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Titel: Verfahren und Vorrichtung zur Datenverarbeitung 



Beschreibung 

5 

Die Erfindung betrifft das oberbegrif f lich Beanspruchte und 
befafit sich somit mit Verbesserungen bei multidimensionalen 
Feldern aus datenverarbeitenden Zellen zur Datenverarbeitung. 

10 

Es sind bereits muitidimensionale Felder • aus datenverarbei- 
tenden Zellen bekannt. Zur Gattuiig dieser Bausteine zahlen 
insbesondere 'systolische Arrays , neuronale Netz'e, Mehrprozes- 
sor Systeme> Prozessoren xait mehreren Rechenwerken und/oder 
15 logischen Zellen und/oder kommunikati-ven/peripheren Zellen 
(10) , Vernetzungs- und Netzwerkbauste.ine wie z.B. Crossbar- 
Schalter, ebenso wie bekannte Bausteine der Gattung FPGA, 
DPGA/ Chameleon^ XPUTER, etc., Es sind insbesondere Bausteine 

bekannt r bei denen erste Zellen wShrend der Laufzeit ohne 

i 

20 Sterung des Betriebes weiterer Zellen umkonfigurierbar sind, 
vgl. etwa die folgenden Schutzrechte und Anmelduhgen dessel- 
ben Anmelders: P 44 16 881. .0-53, DE 197 81 412.3, DE 197 81 
483.2, DE 196 54 846.2-53, DE 196 54 593.5-53, 
DE 197 04 044.6-53, DE 198 80 129.7, DE 198 61 088.2-53, 

25 DE 199 80 312.9, PCT/DE 00/01869, DE 100 36 627.9-33, 
DE 100 28 397.7, DE 101 10 530.4, DE 101 11 014.6, 
PCT/EP 00/10516, EP 01 102 674.7. Diese sind hiermit zu Of- 
f enbarungszwecken vollumf anglich eingegliedert . 

30 Die dergestalt aufgebauten Bausteine weisen eine hohe Lei- 
stungsfahigkeit auf; allerdings ist deren Einsatz aufgrund 
der hohen Kosten oftiaals prohibitiv. Wo Kosten bei hohen 
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Stuckzahlen besonders relevant sind, 1st es daher derzeit tib- 
lich, dedizierte Logikschaltungen in Form von ASICS und 
dergl. vorzusehen. Diese habeft jedoch das Problem, besonders 
hohe Entwicklungskosten mit sich zu bringen, da sowohl der 
Entwurf der Schaltung als auch die Herstellung der Vielzahl 
von Masken teuer ist. 

Die Aufgabe der vorliegenden Erfindung besteht darin, Neues 
fur die gewerbliche Anwendung bereitzustellen. 

• Die Losung dieser Aufgabe wird in unabhangiger Form bean- 
sprucht. Bevorzugte Ausf uhrungsf ormen finden sich in den 
Unteranspruchen . 

15 GemaJS einem ersten Aspekt der vorliegenden ERfindung wird so- 
mit vorgeschlagen, dafi bei einer Datenverarbeitungsanordnung 
mit einem multidimensionalen Feld in Funktion und/oder Ver- 
netzung konf igurierbarer Zellelemente und diesen zugeordneten 
Konfigurationsvorhalte-mitteln zum lokalen Konf igurations- 

20 Vorhalten, vorgesehen ist, dafi die Konf igurationsvorhaltemit- 
tel dazu ausgebildet sind f zumindest einen Teil. der 
vorgehaltenen Konf igurationen. nichtf ltichtig vorzuhalten.. 

Es wird demnach vorgeschlagen, die Leistungsf ahigkeit der 
25 multidimensionalen Prozessorf elder dadurch zu optimieren, dafi 
zunachst zwar eine Vielzahl von Zellen vorgesehen wird, die 
oer se zu einer grofien Vielzahl verschiedener Funktionen be- 
fahigt sind, aber dann aus dieser Vielzahl verschiedener 
Funktionen nur eine oder wenige Funktionen fur jede Zelle 
30 vorzusehen. Hierbei ergeben sich gegenuber dem dedizierten 

Schaltungswentwurf von Asics und dergl., bei denen exakt die 
jeweils far die benotigten Funktionen erf orderlichen Schalt- 
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kreise vorgesehen werden, gravierende Kostenvorteile, weil 
Ruckgriff auf leicht programmierbare Einheiten oder durchge- 
testete Module genommen werdeh und so keine hohen 
Entwicklungs- und/oder Testkosten anfallen, und weil tiberdies 
5 keine hohen Kosten far eine Vielzahl von Mas ken entf alien, 
die beim Entwurf dedizierter Asics sonst fallig sind. Der 
Entwurf kann uber herkommliche Entwurf sprogr amme fur logische 
Schaltungen erfolgen, in denen Module fur die Zellen, Vernet- 
zungsarchitekturelemente usw. bereitgestellt werden, oder 
10 indent eine analoge, rekonf igurierbare Anordnung so konfigu- 
riert wird, bis sie die gewunschten • Ergbenisse liefert und 
dann die entsprechende Funktionalitat in einer Anordnung fest 
vorgegeben wird. 

15 Besonders bevorzugt ist es, wenn die die Funktion grobgranu- 
lar konfigurierbar ist, d.h. wenn das. 

Konfigurationsvorhaltemittel nur wenige Bit vorhalten mufl, urn 
eine jeweilige Funktion der Zelle zu bestimmen. Dies erleich- 
tert es, eine Vielzahl sukzessive abzuarbeitender 

20 Kpnfigurationen vorzuhalten, die aber jeweils oder zumindest 

zum Teil fest vorgegeben sind. Als Zellelemente konnen zumin- ■ 
desteines von ALUs, EAlUs, RAM-Zellen, I/O-Zellen, 
Logiblocken vorgesehen sein. Es kann auch die Vernetzung 
grobgranular konfigurierbar seiri, d.h. es werden nu^r wenige 

25 Bits zu setzen sein, um die Vernetzung vorzusehen. In einer 
alternativen Weise ist .es moglich, die Vernetzung zumindest 
we.itgehend fest vorzugeben und nur die jeweilige Funktion zu 
variieren. Dies ist dann bevorzugt, wenn der fertige Baustein 
etwa in seiner Funktion wie bei der Wave-Rekonf iguration je- 

30 weils eine bestimmte einer vorgegebenen Anzahl von Funktionen 
ausfuhren soil, aber die Vernetzung selbst fest steht. Dazu 
kann- in bestimm-ten Teilbereichen nur eine Nachste-Nachbar- 
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Verbindung vorgesehen werden (auf die parallel eingereichte 
Anmeldung des Anmelders betreffend die Erhohung der Nachste- 
Nachbar-Dimensionalitat bzw. -Konnektivitat sei zu Offenba- 
rungs zwecken hingewiesen. ) , von denen einige der Nachste- 
Nachbar-Verbindungen aktiviert und einige deaktiviert sind. 
In anderen Bereicheri kann dagegen z.B. eine, erf orderlichen- 
falls auch. lauf zeitrekonf igurierbar veranderliche 
Beschaltungsanordnung und/oder Busstruktur vorgesehen werden . 
Es sei darauf hingewiesen, dali abhangig von den Benutzeran- 
forderungen eine Vielzahl unterschiedlicher Aufgaben mit 
einer bis auf die Konf igurationsvorgabe unveranderten Bau- 
steinen vorgesehen werden kann, so daft sich Maskenkosten auf 
eine Vielzahl von Bausteinen verteilen und damit nicht mehr 
so stark ins Gewicht fallen. 



Es ist bevorzugt, wenn jedem Zellelement ein eigenes Konf igu- 
rationsvorhaltemittel zugeordnet ist, Diese konnen die bei 
XPP-Architekturen vorgesehenen, von einem zentralen Konfigu- 
rationsspeicher zugreifbaren Konf igurationsregister ersetzen. 
Es ist moglich, in den Konf igurationsvorhaltemittel eine 
. Vielzahl von Konf igurationen vorzuhalten; dies erlaubt etwa 
die Re konf iguration im Betrieb, ohne dafi eine ebenfalis teure 
•und Siliziumf lache erfordernde Konf igurationseinheit inte- 
griert sein muli. Die Auswahl der jeweils zu aktivierenden 
25 Konf igurationen kann innerhalb des Feldes uber Statustrigger, 
. Datenoperationen, Sequenceranordnungen etc. erfolgen. Es ist 
dabei auch bevorzugt, wenn mehrere fest vorgegebene nicht- 
fltichtige Konf igurationen im Konf igurationsvorhaltemittel 
vorgegeben sind. Alternativ sind fluchtige und nicht f Itichtige 
30 Konf igurationen einsetzbar. Es wird darauf hingewiesen, dafi 
eine vollstandige oder partielle Konf igurationsvorgabe vor 
der oder jeder eigent lichen Inbetriebnahme erfolgen kann. Da- 
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zu konnen auf geeignete Weise eingegebene Daten als Konfigu- 
rationen behandelt werden, die abzulegen sind. Da solche eine 
Vorab-Ablage von Rekonf igurationsdaten nicht betreibssto- 
rungsfrei geschehen mufl, eroffnen sich hier weitere 
5 Moglichkeiten, die Architektur zu vereinf achen; auf das sog. 
Wormholerouting sei 'hingewiesen, das bei lauf zeitrekonf igu- 
rierbaren Einheiten nicht funktioniert . Alternativ und/oder 
zusatzlich kann vorgesehen sein, dafl bei einigen Zellen im 
Betrieb mit veranderlichen Konf igurationen versehbare Konfi- 
10 gurationsvorhaltemittel vorgesehen sind, d.h. ein Teil der 

Zellen uber einen Konf igurationsmanager oder auf .andere Weise 
umkonf iguriert wird. 

Die wechselnde der Vielzahl von vorgehaltenen und/oder vor- 
15 bestimmten Konf igurationen, die jeweils zu verwenden ist, 

kann insbesondere im Wege der Wave-Rekonf iguration oder des 
lokalen Sequencing bestimmt bzw. geandert werden. 

Es ist moglich, die Konf igurationsvorhaltemittel auszubilden 
20 als ROM, EPROM, EE PROM, Flash^Speicher, Fuse-, Antifuse- 

programmierbare Speichermittel und/oder in insbesondere in 
oberen Lagen einer Siliziumstruktur fest vorgesehene Spei- 
chermittel gewahlt sind, Besonders bevorzugt sind 
Anordhugnen, die leicht und einfach bei einer groJien Stuck- 
25 zahl die Konf iguration vorsehen. Dies ist durch geeignete 

Maskierung bei der Herstellugri auf den oberen Metalllag.en er- 
reichbar (ZiB.Lage M4 und/oder M5) und/oder durch 
Fuse/Antifuse-Techniken. Letztere haben den Vorteil, dafi bei 
Funktionsanderungen in einer laufenden Serie Anderungen 
30 leicht er implementierbar sind. 
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Mit der Anordnung kann ein Baustein festgelegter Funktion er- 
halten werden, indem ein multidimensionales Feld mit in 
Funktion und/oder Vernetzung konf igurierbaren Zellelementen 
und diesen zugeordneten Konf igurationsvorhaltemitteln zum lo- 
5 kalen Konf igurations -Vorhalten vorgegeben wird, bestimmt 

wird, welche Konfigurationen in diesen vorzuhalten sind, und 
dann nichtf liichtige Konf igurationsvorhaltemittel so vorgese- 
hen werden, dafi sie zumindest einen Teil der vorgehaltenen 
Konfigurationen nichtf luchtig vorhalten. Es kann dabei von 

10 einem zur lauf zeitrekonf igurierbaren multidimensionalen Feld 
ausgegangen werden, das ein hohere Funktionalitat besitzt und 
es kann dann das Design urn bestimmte Funktionen reduziert 
werden, bis ein Kern-Bauelelement oder -elementblock mit vor- 
gegebener Architektur erhalten wird, bei dem nur noch wenige 

15 freie Konfigurationen zu bestimmen sind. 



Dieser Aspekt der Erfindung wird beschrieben nur besipielhaft 
beschrieben mit Bezug auf die Zeichung, in welcher zeigt 

Fig Al eine erf indungsgemafle Datenverarbeitungsanorn- 
20 dung 

Fig. A2 Details hierzu 

Nach Fig. 1 umfafit. nun eine allgemein mit 1 bezeichnete Da- 
tenverarbeitungs anordnung 1 mit ' einem multidimensionalen Feld 

25 in Funktion und/oder Vernetzung konf igurierbarer Zellelemen- 
te 2 und diesen zugeordneten Konf igurationsvorhaltemitteln 2a 
zum lokalen Konf igurations -Vorhalten , wobei die Konfigurati- 
onsvorhaltemittel 2a dazu ausgebildet sind f zumindest einen 
Teil der vorgehaltenen Konfigurationen nichtf luchtig vorzu- 

30 halten. 
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Das multidimensional Feld 1 umf aJJt im vorliegenden Beispiele 
jeweils drei Reihen und Spalten PAEs, wie sie aus den Ein- 
gangs erwahnten und weiteren Verof f entlichungen des Anmelders 
per se bekannt sind. Diese Einheiten weisen grobgranular kon- 
fuigurierbare ALUs 2b auf , an die iiber Multiplexer 2c Daten 
von einem Bussystem '2d eingehen und die beidseits mit Vor- 
warts-/Riickwartsregistern 2e, 2f wie per se bekannt flankiert 
sind. Weiter speisen sie Ausgangsdaten iiber einen weiteren 
Multiplexer 2g auf ein Bussystem in der Reihe darunter auf. 
Die Funktionsweise der Multiplexer 2g,2c sowie jene der ALU 
2b und der Register 2e,2f ist 'pei: se bekannt und wird hier 
nicht detailliert erlautert. Die Konf iguration, die diese 
Einheiten haben, d.h. die Verbindung, die der Multiplexer je- 
weils aktiviert, bzw. die jeweilige Funktion der ALU, sind im 
Konfigurationsspeicher 2h abgelegt. Dabei konnen fur Se- 
quencing Oder Wave-Rekonfigu-ration eine Vielzahl von 
untershceidlichen Konf igurationen abgelegt sein, die auf Si- 
gnale aus den Zellen oder auf externe Signale hin aktivierbar 
sind. Dabei muii nicht fur alle Konf igurationen ein fester, 
unveranderlicher Speicher vorgesehen sein, sondern es kann 
auch. in bestimmten Fallen ein (gegebenenf alls vergleichsweise 
kleiner) Speicher vorgesehen werden. Dies erlaubf demanch ei- 
nen Zell- bzw- Speichermix. 

Wahrend in bisherigen Architekturen der Konfigurationsspei- 
cher veranderlich war, und etwa von einer zentralen 
Konfigurationseinheit angesprochen wurde, ist im vorliegenden 
Fall der Konfigurationsspeicher 2h nichtf luchtig gebildet und 
sein Inhalt bei der Herstellung des" die Elemente enthaltenden 
ICs festgelegt. 



Dies geschieht wie folgt: 
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Zunachst wird festgelegt, welche Anzahl an Zellen und gegebe- 
nenfalls welche Zellen fur die erwartete und mit der 
Datenverarbeitungsanordnung 1 abzuarbeitende Aufgabe erfor- 
5 derlich sind. Dann werden mit diesen die Funktion simuliert. 
Das kann fiber Emulator en geschehen oder es kann ein Feld 
lauf zeitrekonf igurierbaren Elemente mit zentraler Konfigura- 
tionseinheit zur Funktionsentwicklung bzw. zum Funktionstest 
herangezogen werden. Sobald die Funktionsentwicklung abge- 

10 schlossen ist und die erf orderlichen Konf igurationen 

festgelegt sind, wird ein Chip entworfen, der in seinem gro- 
ben Aufbau einer Vielzahl anderer, gleichartiger Chips 
entspricht und sich lediglich hinsichtlich der nichtf luchti- 
gen Konf igurationsspeicherinhalten von jenen unterscheidet . 

15 Es wird dann festgelegt, ob die nichtf luchtigen Konfigurati- 
onsspeicherinhalte mit dedizierten Metall-Lagen festgelegt 
werden und/oder durch Brennen/Schmelzen bestimmter, zur Kon- 
figuration vorgesehener Fuses/Antifuses oder auf andere 
Weise. Die Speicherinhalte werden dann .wahrend der Herstel- 

20 lung des Prozesses vorgesehn und der Chip ist fur seine 

dedizierte Aufgabe ohne eine Vielzahl teurer Masken verwend- 
bar. Dabei sind zB regionale Anpassungen moglich, zB, urn 
unterschiedliche Modems etc. zu implementieren. 

25 In einem weiteren Aspekt der Erfindung befafit sich diese mit 
der integrierten elektronischen Verarbeitung von Informatio- 
nen, die in Form analoger Signale vorliegen. Dabei ist 
besonders hervorzuhebeh, daJ5 etwa die analoge Verarbeitung, 
wie ersichtlich sein wird, auf fest vorgespeicherte Konfigu- 

30 rationen zuruckgreif en kann r daJB dafur aus unterschiedlichen 
Konfigurationen auswahlbar ist und daB etwa bestimmte Zell- 
formen gleichfalis vorteilhaft sind. Fur die integrlerte 
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elektronische Verarbeitung von Inf ormationen, die in Form 
analoger Signale vorliegen, existieren gegenwartig mehrere 
Konzepte: 

5 - Diskrete analoge, nicht programmierbare Bausteine, wie etwa 
Transistoren und Operationsverstarker; 



- Analoge, programmierbare, integrierte Schaltkreise, genannt 
FPAAs (Field Programmable Analog Arrays) , FPMAs (Field Pro- 

10 grammable Mixed-Signal Arrays) oder FPADs (Field Programmable 
Analog Devices) . .FPAAs, FPMAs und FPADs bestehen ahnlich wie 
die digitalen FPGAs (Field Programmable Gate Arrays) aus ein- 
zelnen, programmierbaren Zellen. Im Fall von FPAAs, FPMAs und 
FPADs ist das Kernstuck einer solchen Zelle ein analoger 

15 Operationsverstarker, dem eine bestimmte Funktion aus einem 
Satz moglicher Funktionen zugewiesen werden kann. Mogliche 
Funktionen sind zum Beispiel Addierer, Inverter, Gleichrich- 
ter und Filter erster Ordnung, mit denen ein analoges Signal 
. bearbeitet werden kann. Die Zellen stehen untereinander durch 

20 ein Bus system in Verbindung und werden durch logische Elemen- 
te gesteuert; 

- Anwendungsspezif ische, nicht programmierbare integrierte 
Schaltkreise, 

25 genannt ASICs (Application Specific Integrated. Circuits) ; 

- Programmierbare, voll digitale Prozessoren, genannt DSPs 
(Digital Signal ' Processors) oder CPUs (Central Processing 
Units) , die der digitalen Verarbeitung analoger Signale. nach 

30 deren vorhergehender Arialog-Digital-Wandluhg dienen. Wenn 
nach der Verarbeitung wieder ein analoges Signal vorliegen 
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soil, muss nach der Verarbeitung eine Digital-Analog-Wandlung 
des Signals vorgenommen werden. 



5 Probleme 

Diskrete analoge Baiisteine 

Eine Schaltung mit diskreten Bauelementen kann aufgrund ihrer 
primaren Flexibilitat zwar optimal fur eine bestimmte Aufgabe 
ausgelegt werden. 

10 

Die Aufgaben der Schaltung mussen allerdings zum Zeitpunkt 
des Schaltungsentwurf s genau bekannt sein, denn eine nach- 
tragliche Anpassung der Schaltung an veranderte Anf orderungen 
ist nicht oder nur mit erheblichem Aufwand moglich. Dies gilt 
15 insbesondere fur die Programmierbarkeit und fur Umkonfigura- 
tionen im Betrieb. AuBerdem wird eine solche Schaltung bei 
komplexeren Aufgaben schnell umf angreich. 

FPAAs, FPMAs, FPADs 

20 Die durch FPAAs, FPMAs und FPADs gegebenen Moglichkeiten zur 
Verarbeitung analoger Signale orientieren sich am Vorbild 
klassischer analoger Signalverarbeitungsanlagen. 
Sie sind fur das zu verarbeitende Signal weitgehend- transpa- 
rent, das heiiit, das zu verarbeitende Signal wird bis zu 

25 einer bestimmten, bausteinabhangigen Frequenz in Echtzeit be- 
arbeitet. 

Eine einfache Moglichkeit, analoge Werte zu speichern, exi- 
st iert nicht , insbesondere nicht die Moglichkeit r ' den 
analogen Eingangswert und/oder den Ausgangswert jeder einzel- 
30 nen Zelle zu speichern, Viele wichtige Operationen, wie etwa 
Schleif enberechnungen, und samtliche Prozesse, bei denen meh- 
rere Signale zeitlich koordiniert nacheinander verarbeitet 
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werden, werden durch Speicherung jedoch erst moglich. Eine 
einzelne FPAA-, FPMA- oder FPAD-Zelle kann zwar als Speicher 
nach Art einer Sample-and-Hold-Stufe konf iguriert werden. Sie 
kann dann jedoch keine zusatzliche Funktion mehr ausUben. 

FPAAs, FPMAs und FPADs sind aufgrund ihrer ausschliefilich 
analogen Signalverarbeitung funktionellen Einschrankungen un- 
terworfen. Die Fahigkeiten der in FPAAs, FPMAs und FPADs 
implementierten digitalen Logik beschranken sich auf die 
Funktionen, die far die Umkonf iguration der Zellen notwendig 
sind. Die Funktion der Zellen, die diese wahrend des Betriebs 
ausuben, wird durch die Logik im Stand der Technik nicht un- 
terstutzt, geschweige denn erweitert, etwa durch digitale 
Zahlfunktionen oder logische Grundf unktionen wie beispiels- 
weise NAND und NOR. Insbesondere gibt es keine jeweils zu 
einer einzigen Zelle gehorenden logischen Strukturen, die 
solche digitalen Zahlfunktionen oder logischen Grundf unktio- 
nen durchfuhren kSnnen. Dali hier erf indungsgemali Abhilfe 
geschaf fen wird, sei im Vorgriff erwahnt . . Hit FPAAs, FPMAs 
und FPADs sind deshalb logische Funktionen wie zum Beispiel 
eingangssignalabhangige Entscheidungen, wenn ttberhaupt, nur 
in geringem Mafie oder nur sehr aufwendig moglich. 

Dasselbe gilt fur die datenabhangige Rekonf iguration von 
FPAAs, FPMAs und FPADs, beispielsweise (aber nicht nur) nach 

• Art einer IF-THEN-ELSE-Anweisung. Diese wird erf indungsgemafi 
ermoglicht. Soil eine FPAA-, FPMA- oder FPAD-Zelle aufgrund 
von Kriterien, die die zu verarbeitenden oder bereits verar- 
beiteten Analogsignale betref fen, rekonf iguriert werden, so 

) mufi das betroffene Analogsignal Uber eine temporare oder so- 
gar permanente Verbindung nach aulien zu einer externen, nicht 
in dem FPAA, . FPMA oder FPAD enthaltenen Struktur gef iihrt 
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werden, welche iiber eine etwaige Rekonf iguration entscheiden 
und diese Rekonf iguration auslosen und durchfuhren mufi. Es 
besteht far die Zelle keine MQglichkeit, abhangig von einem 
Analog- oder Digitalsignal selbstandig, das heiflt mit ihr ei 
5 genen Strukturen, tiber eine Rekonf iguration ihrer selbst zu 
entscheiden, diese Rekonf iguration zu veranlassen und die da 
zu notwendigen Daten von einer internen, auf dem Baustein 
enthaltenen, dafur geeigneten Struktur zu erhalten. 

10 Will man das Ergebnis der Operation einer Zelle auf deren 
Eingang fuhren, zum Beispiel bei Schleif enoperationen, so 
kann das bei FPAAs, FPMAs und FPADs nur mittels des Busses 
geschehen; eine eigene Leitung zur Riickf iihrurig des Operati- 
onsergebnisses auf den Eingang der Zelle zur Entlastung des 

15 Busses ist bei FPAAs, FPMAs und FPADs nicht vorgesehen. 

Die genannten Nachteile schliefien es aus, mit FPAAs, FPMAs 
und/oder FPADs ein analoges Rechenwerk aufzubauen, das die 
Flexibilitat und den Funktipnsumf ang heutiger digitaler Re- 
20 chenwerke erreicht. 

ASICs 

ASICs besitzen eine hohe primSre Flexibilitat , da sie fur ei 
ne spezielle Anwendung entwickelt werden. Sie eignen sich 

25 jedoch nur fur diejenige Anwendung, fur die. sie entwickelt 

werden; rekonf igurierbar sind" ASICs nur in demjenigen Rahmen 
den die Anwendung vorgibt. andert sich die Anwendung urn ein 
Detail, welches bei der Entwicklung des ASICs nicht beriick- 
sichtigt wurde, so mufi im Extremfall ein neuer ASIC 

30 entwickelt ' werden . 

. DSPs und CPUs 
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Unter alien Moglichkeiten zur Signalverarbeitung konnen DSPs 
und CPUs zwar am flexibelsten konf iguriert und rekonf iguriert 
werden, allerdings weder teilweise, noch wahrend der Lauf- 
zeit . 



Urn Analogsignale in ein fur DSPs oder CPUs geeignetes Format 
umzuwandeln, miissen die analogen Signale digital kodiert wer- 
den. Dies erfordert eine Analog-Digital-Wandlung, die 
bei hoheren Anf orderungen an die Prazision recht aufwendig 

10 und teuer werden und uberdies noch die Bandbreite beschranken 
kann. Entsprechendes gilt fur die Rue ktrans formation der di- 
gitalen, verarbeiteten Daten in Analogsignale. Um 
ausreichende Schnelligkeit zu erzielen, miissen die internen 
Bussysteme in DSPs und CPUs die einzelnen Bits eines digital 

15 kodierten Analogsignals parallel ubertragen. Die erforderli- 
che Breite des Datenbussystems wachst mit der geforderten 
Prazision der digitalen Kodierung des Signals. Im Gegensatz 
dazu genugt bei einer analogen Ubertragung eine Leitung pro 
ubertragenem Analogsignal.- 

20 

DSPs und CPUs besitzen uberdies keine zellartige Struktur, 
sondern sind in der klassischen von-Neumann-Architektur auf- 
gebaut. Ihre Modularitat ist deshalb nur gering. 

25 Die heute exististierenden analogen Rechenwerke erreichen bei 
weitem nicht den Funktionsumf ang und die Konf igurierbarkeit 
heute exist ierender digitaler Rechenwerke. 

Umgekehrt werden analoge Schaltungen zunehmend durch digitale 
Rechenwerke ersetzt, etwa im Fall der DSPs, wobei man die bei 
30- den DSPs genannten Nachteile in Kauf zu nehmen hat. 

Die heute existierenden Methoden zur Verarbeitung analoger 
Signale haben zum Ziel,. diese analogen Daten zu modif izieren. 
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Sind die dazu verwendeten Bausteine konf igurierbar, dann wird 
die Art und Weise, wie die analogen Signale zu modif izieren 
sind, ausschliefilich durch digitale Logik eingestellt, das 
heiflt, die Steuerung erfolgt ausschliefilich durch digitale 
5 Signale. Es existieren weder Moglichkeiten, die Datenverar- 
beitungssteuerung urimittelbar durch analoge Signale 
vorzunehmen, noch Moglichkeiten, analoge Signale mit dem 
Funktionsumf ang eines digitalen Rechenwerks zu bearbeiten. 



10 Die Erfindung umfafit somit auch ein programmierbares, zumin- 
dest teilweise analoges Rechenwerk (Reconf igurable Analog 
Processor, RAP) mit durch logische Elemente erweiterten Funk- 
tionen, in der Weise, dafi der Funktionsumf ang eines digitalen 
Rechenwerks verbunden wird mit der Moglichkeit zur schnel- 

15 len, analogen Berechnung komplexer Funktionen (etwa der 

Logarithmusfunktion) und der Rekonf igurierbarkeit eines DFPs 
wie zb gemafi Of f enlegungsschrif t DE4416881A1. 

Ein RAP besteht aus Zellen, die in ihrer Funktion und Vernet- 
20 zung frei konf igurierbar und wahrend der Laufzeit 

rekonf igurierbar sind. Bei der Rekonf iguration einer einzel- 
nen Zelle wahrend der Laufzeit werden andere - Zellen nicht in 
ihrer Arbeit beeintrachtigt . Eine Zelle ist unterteilt in ei- 
ne Analogsektion und eine Logiksektion. Die Analogsektion 
25 dient der Verarbeitung analoger Daten auf der Basis von Ope- 
rationsverstarkerschaltungen, wie sie von FPAAs, FPMAs und 
FPADs her bekannt sind. Die Logiksektion ste'uert die Funktio- 
nen der Analogsektion wahrend der Laufzeit, bei der 
Anfangskonfiguration und bei der Umkonf iguration wahrend der 
30 Laufzeit. 
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Die Analogsektion kann aber auch analog gesteuert und konfi- 
guriert werden. Die Datenverarbeitung findet wie bei FPAAs, 
FPMAs und FPADs in erster Linie analog statt; der Funktion- 
sumfang wird jedoch durch besondere Strukturen mit jeweils 
5 einer Logiksektion und verschiedenen Speichern in jeder Zelle 
dahingehend erweitert, dafi in der Zelle eingangsdatenabhangi- 
ge logische Operationen, Vergleiche, Schleif enoperationen und 
Zahlvorgange schnell und einfach durchgefuhrt werden konnen, 
so dafi ein Funktionsumf ang ahrilich dem eines voll digitalen 
10 Rechenwerks erreicht wird. 



Es besteht fur jede RAP-Zelle zur Vereinf achung ihrer Rekon- 
f iguration die Moglichkeit, abhangig von eineiri Analog- oder 
Digitalsignal selbstandig, das heifit mit ihr eigenen, inter- 
15 nen Strukturen, uber eine Rekonf iguration ihrer selbst zu 

entscheiden, diese Rekonf iguration zu veranlassen und die da- 
zu notwendigen Daten von einer daf ur geeigrieten Struktur zu 
erhalten. 

20 Zwei unabhangige r rekonf igurierbare Bussysteme, eines fur 
analoge Signale, das andere fur digitale Signale, vernetzen 
die Zellen untereinander und mit der Aufienwelt. Jedes analoge 
Signal benotigt zu seiner Obertragiing nur eine analoge Bus- 
. leitung. Bei eihem .digitalen Bus wachslt die Zahl der 

25 benotigten Leitungen bei paralleler Oijertragung mit der g.e- 
fbrderten Prazision der digitalen Codierung des analogen 
Signals stark an. Die notwendige Busbreite eines analogen 
Busses ist deshalb im Vergleich zu der eines digitalen Busses 
bei vergleichbarer Signalauf losuhg und Ubertragungsrate ganz 

30 wesentlich verringert. Es sei erwahnt, dass auf einem inte- 
grierten Schaltkreis Mischungen vorliegen konnen aus analogen 
und digitalen Schaltkreisen; dabei kann eine weitgehende 
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Trennung und/oder Ubergangsbeschaltung z. B. in Form von DACs 
und/oder ACDs zwischen analogen und digitalen Elementen vor- 
gesehen werden. Die digitalen' Element e konnen ihrerseits 
durch PAEs, RAM-PAEs usw. insbesondere mit geeignetem Aspekt- 
5 verhalten gebildet sein. 

Die Erfindung beschreibt in diesem Teilaspekt sonst u.a. ein 
analoges, umkonf igurierbares Rechenwerk (Reconf igurable Ana- 
log Processor, RAP) aus einzelnen funktionalen Zellen, die 

10 durch ein geeignetes Bussystem untereinander und mit der Au- 
fienwelt verbunden sind. Die Funktion der Zellen ist 
konf igurierbar und kann wahrend des Betriebs so rekonfigu- 
rierbar sein, dafi dabei die Funktion anderer, nicht' zu 
rekonf igurierender Zellen nicht beeintrachtigt wird. Eine 

15 funktionale Zelle enthalt eine Analogsektion und eine Logik- 
sektion. Die Analogsektion dient der Verarbeitung analoger 
Daten a.uf der Basis von Operationsverstarkerschaltungen. Die 
Logiksektion steuert die Funktionen der Analogsektion wahrend 
der Lauf zeit, bei der Anf angskonf iguration und bei der Umkon- . 

20 figuration wahrend der Lauf zeit, Aufierdem erweitert die 

Logiksektion die rein analogen Funktionen der Analogsektion 
durch die Bereitstellung von zb Logikf unktionen und/oder di- 
' gitalen Zahlf unktionen und/oder arithmetishcen und/oder 

Speicherelementen. Jeder Zelle konnen ein oder mehrere analo- 

25 ge Speicher zugeordnet sein, die analoge Grofien wie 

beispielsweise Eingangs- oder Ausgangssignale speichern und 
zur weiteren Verarbeitung bereitstellen konnen- Auflerdem ge- 
horen zu jeder Zelle ein oder mehrere digitale Register zur 
Speicherung von digitalen Daten, die fur die. Konf iguration 

30 und den Betrieb der Zelle notwendig sind. 
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Fur jede Zelle besteht die Moglichkeit, abhangig von einem 
Analog- oder Digitalsignal selbstandig, das heifit mit ihr ei- 
genen internen Strukturen, iiber eine Rekonf iguration ihrer 
selbst gegebenenfalls zu Gruppen zusaramengef aflter Zellen oder 
5 anderer Zellen zu entscheiden, diese Rekonf iguration zu ver- 
anlassen und die dazu notwendigen Daten von einer dafiir 
geeigneten Struktur, welche sich auf dem Baustein befinden 
kann, zu erhalten. Es existiert weiterhin die Moglichkeit, 
das analoge Ergebnis der Operation einer Zelle ohne Zugriff 
10 auf ein Bussystem auf den analogen Dateneingang der Zelle zu- 
ruckzuf uhren. 

In diesera Abschnitt werden Begriffe verwendet, deren Bedeu- 
tung von der allgemein gebrauchlichen in manchen Punkten 
15 abweichen kann. Zum besseren Verstandnis folgen die Begriffs- 
def initionen, wie sie in diesem Abschnitt verwendet werden. 

Ein Signal soli hier definiert sein als eine Groiie, bei- 
spielsweise eine Spannung U_0 (t) , die zu einem bestiinmten 

20 Zeitpunkt an einem bestimmten Punkt einer Schaltung herrscht. 
Ein solcher Punkt kann beispielsweise ein Ausgang, ein Ein- 
gang oder eine Busleitung sein. Die Spannung U_0 (t). kann 
entweder auf Masse (GND) oder auf eine zweite Spannung U_l(t) 
bezogen sein. Das Signal kann zeitlich konstant oder zeitlich 

25 veranderlich sein. 

Information soil . hier definiert sein als Anzahl der mogli- 
chen, unterscheidbaren Zustande, die ein Signal annehmen 
kann . 



dann bezeichnet werden, wenn es nur zwei Zustande, beispiels 



30 



Als digitales Signal oder Digitalsignal soil hier ein Signal 
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weise 0 oder 1, annehmen kann, also nur zwei Inf ormationen im 
Sinne der hier verwendeten Definition der Information bein- 
haltet. 

5 Als analoges Signal Oder Analogsignal soli hier ein Signal 

dann bezeichnet werden, wenn es mindestens drei und hochstens 
abzahlbar unendlich viele Zustande annehmen kann, also mehr 
als zwei Inf ormationen im Sinne der hier verwendeten Defini- 
tion der Information beinhaltet. Das bedeutet insbesondere, 
10 daii mittels analogen Signalen iramer mehr Inf ormationen 

gleichzeitig uber eine Leitung ubertragen werden konnen als 
mit digitalen Signalen. 

Im folgenden wird der Aufbau einer erf indungsgemafien funktio- 
15 nalen Zelle und der Aufbau des zugehorigen, die Zellen 
vernetzenden Bussystems beschrieben. 



Die Zelle 

20 Eine Zelle stellt die kleinste vollstandige, selbstandige 

funktionale Einheit eines RAPs dar. Dabei sind zwei verschie- 
dene Typen von Zellen moglich — die einfache Zelle und "die 
erweiterte Zelle. Beide Zelltypen konnen auf einem RAP zum 
Einsatz kommen. Sie unterscheiden sich im Funktionsumf ang. 

25 Beiden Zelltypen gemeinsaia ist die Unterteilung ihrer Struk- 
tur in eine Analogsektion und eine Logiksektibn. 

Einige oder alle Zellen konnen einen. T.aktvervielf acher zur 
Erzeugung eines lokalen, auf die Zelle beschrankten hoheren 
30 Taktes beinhalten f der beispielsweise die Zahlf unktionen der 
Logiksektion der Zelle unterstutzt. Denkbar ist auch, dafi ei- 
nige oder alle Zellen Strukturen zur Erzeugung. eines 
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zellinternen oder lokal begrenzten Zelltakts beinhalten k6n- 
nen, dessen Frequenz unabhangig von der Frequenz eines 
etwaigen Bustakts konf iguriert werden kann. Der Zelltakt kann 
aktivierbar und deaktivierbar sein. 



Die einfache Zelle (SCELL) 

Die Elemente der einfachen Zelle (SCELL) gliedern sich in 
10 zwei Gruppen, genannt Analogsektion und Logiksektion. Die 

Analogsektion dient der analogen Datenverarbeitung der analo- 
gen Eingangssignale einer Zelle, kann aber auch analoge 
Signale erzeugen, wie beispielsweise (aber nicht nur) ein 
Rechtecksignal oder ein Dreiecksignal . Die Logiksektion 
15 stellt zusatzliche nicht-analoge Funktionen zur Verfugung, 
insbesondere zB eingangsdatenabhangige logische Operationen, 
Vergleiche und Zahlvorgange, Speicher und/oder arithmetische 
Operationen und steuert dariiberhinaus die Tatigkeit der ge- 
samten SCELL. Ein Element der Logiksektion ist die 
20 Steuerlogik (CL) . Sie steuert die Funktionen der Analogsekti- 
on und verwaltet Signale zur Rekonfiguration der Zelle, die 
Ober die Bussysteme erhalten oder abgeschickt werden.. 

Die Analog-Eingangsstufe der SCELL ist ein Multiplexer (MUX0) 
25 nach Sj:and der Technik fur Analogsignale. Das zu verarbeiten- 

de analoge Signal wird von einem analogen Datenbus system 

(ABUS) auf die Eingange von MUX0 gefuhrt. MUX0, gesteuert von 

der CL, selektiert das von der SCELL zu verarbeitende Ana- 

logsignal und schaltet es zu der analogen 
30- Verarbeitungseinheit (APU, Analog Processing Unit) durch. Die 

APU ist eine konf igurierbare Einheit nach Stand der Technik. 

Sie enthalt. eine oder mehrere Operationsverstarkerschal- 
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tung/en, deren Funktion aus einem Satz moglicher Funktionen 
ausgewahlt werden kann. Die Auswahl der Funktion geschieht 
mittels eines digitalen Signals von der CL. 

5 Funktionen der APU konnen beispielsweise (aber nicht nur) 
sein: 

- Addition einer programmierbaren Grofie zum analogen Ein- 
gangssignal der APU 

10 - Subtraktion einer programmierbaren Groiie vom analogen Ein- 
gangs signal der APU 

- Multipiikation des analogen Eingangssignals der APU mit 
einer programmierbaren GroJSe 

- Division des analogen Eingangssignals der APU durch eine 
15 programmierbare Grofie, Division einer programmierbaren Grofie 

durch das analoge Eingangssignal der APU 

- Logarithmierung des analogen Eingangssignals der APU 

- Antilogarithmierung des analogen Eingangssignals der APU 

- Invertierung des analogen Eingangssignals der APU 

20 - Keine Veranderung des analogen Eingangssignals der APU 

- Filterfunktionen, beispielsweise Hochpasse, Tiefp^sse, 
Bandpasse und- Notchf ilter 

- Signaler zeugung, beispielsweise Rechtecksignale, Dreiecksi- 
gnale und Sinussignale mit programmierbaren Zeitkonstanten 

25 - Potenzierung 

- -Speicherung 

Das zu verarbeitende analoge Signal wird entsprechend der 
durch die CL programmierten Funktion in der APU verandert 
oder (in der Funktion eines Spannungsf olgers) nicht veran- 
30 dert, oder die APU dient der Erzeugung eines neuen analogen 
Signals, Denkbar ist insbesondere die Erzeugung eines Si- 
gnals, das eine Rekonf igurationsauf f orderung darstellt, und 
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in dem die notwendigen Rekonf igurationsparameter in analoger 
Form kodiert sind. Der analoge Ausgang der APU ist an eine 
Speicherstufe (BIPS) angeschlbssen. Die BIPS kann sich in 
einem von mehreren durch die CL programmierbaren Zustanden 
5 befinden, beispielsweise in einem der folgenden. 

BUFNONINV: Das Ausgangssignal der BIPS hat denjenigen Wert, 
der an ihrem Eingang lag, als die BIPS ein BUFFER-Signal von 
der CL erhielt. Der Ausgangswert wird konstant gehalten, so- 
10 lange das BUFFER-Signal anliegt. 

BUFINV: Das Ausgangssignal der BIPS hat denjenigen invertier- 
ten Wert, der an ihrem Eingang lag, als, die BIPS ein BUFFER- 
Signal von der CL erhielt. Der Ausgangswert wird konstant ge- 
15 halten, solange das BUFFER-Signal anliegt. 

INVERT: Das Eingangssignal der BIPS wird invert iert. 

PASS: Die BIPS schleift das Eingangssignal unverandert durch. 

20 

3 STATE : Der Ausgang der BIPS nimmt einen hochohmigen Zustand 
ein. 

Dei: Ausgang der BIPS ist mit dem Eingang eines analogen De- 
25 multiplexers (DeMUX) verbunden, dessen Ausgange mit den 

Busleitungen des ABUS verbunden sind. Ober die CL wird ge- 
steuert, auf welchen Ausgang des DeMUX das verarbeitete 
analoge Signal geftihrt wird. 

30 Als zusatzliches Element der Logiksektion einer SCELL zur Er- 
weiterung des Funktionsumf anges der SCELL existiert die 
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LOGUNIT. Sie ist in der Lage, beispielsweise folgende Funk- 
tioneri durchzufuhren: 

- digitale Zahler, die von der CL und/oder der APU gesetzt, 
getriggert, abgefragt ruckgesetzt und angehalten werden kon- 
nen; diese konnen als grobgranulare Logikelemente gebildet 
sein; andere grobgranulare Logik- und/oder Funktionselemente 
wie arithmetische, insbesondere ALUartige und/oder speichern- 
de Elemente sind gleichfalls implementierbar . 

- logische' Grundf unktionen, wie NAND, NOR, AND, OR, XOR, 
INVERT, BUFFER, die aus der - CL und/oder APU stammende Infor- 
mationen logisch miteinander verkmipfen konnen. Hier handeit 
es sich also urn f eingranulare Logikelemente. Solche Informa- 
tionen konnen abhangig vom Status der CL und/oder der APU 
sein, und/oder von zu verarbeitenden Signalen. Insbesondere 
konnen solche Inf ormationen Kriterien sein, die auch zur Bil- 
dung eines RECONREQ-Signals (Rekonf iguration-Request ) fiihren. 

Die erweiterte Zelle (ECELL) 

Die erweiterte Zelle (ECELL) enthalt in einer bevorzugten 
Aus fuhrungs form eine vollstandige, voll funktionale SCELL, 
die um zusatzliche Elemente und Funktionen erweitert wurde, 
urn insbesondere (aber nicht nur) Schleif enoperationen ohne 
Zugriff auf das Bussystem. durchftihren zu konnen. 

Die analoge Eingangsstuf e (MUXO) ist um einen zweiten, 
gleichwertigen, auf den ABUS zugreifenden analogen Multiple- 
xer (MUX1) erweitert. Mit MUXO und MUX1 ist es moglich, statt 
(wie bei einer SCELL) nur. einem Eingangssignal zwei Eingangs- 
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signale zur anschliefienden Verarbeitung in der Zelle freizu- 
geben. Aufier den Busanschlussen besitzen MUXO und MUX1 
jeweils zusatzlich noch einen * Eingang, der-auf Masse gelegt 
ist und einen Eingang, auf den das Ergebnissignal vom Aus- 
gang der BIPS der ECELL zuruckgef tihrt wird. Der Ausgang von 
MUXO fiihrt das von MUXO zur Verarbeitung selektierte Ana- 
logsignal, welches ausdriicklich auch der konstante 
Massepegel oder das Ergebnissignal vom Ausgang der BIPS der 
ECELL sei kann. Der Ausgang von MUX1 fiihrt das von MUX1 zur 
Verarbeitung selektierte Analogsignal, welches ebenfalls auch 
der konstante Massepegel oder das Ergebnissignal vom Aus.gang 
der BIPS der ECELL sei kann. 

Die Ausgangssignale von MUXO und MUX1 werden auf die folgen- 
15 den, programmierbaren Speicherstuf en (BUFFO, BUFFI) gefuhrt. 
BUFFO erhalt das Ausgangssignal von MUXO, BUFFI erhalt das 
Ausgangssignal von MUX1. BUFFO und BUFFI sind durch die CL 
konfigurierbare Einheiten, deren Funktion aus einem Satz 
moglicher Funktionen ausgewahlt werden kann. Mogliche Funk- 
20 tionen von BUFFO und BUFFI sind beispielsweise 

BUFNONINV: Der Wert des Ausgangs signals von BUFFO bzw. BUFFI 
ist gleich demjenigen analogen Eingangssignal, das anlag, als 
BUFFO bzw. BUFFI, ein BUFFER- Signal von der CL erhielt. Der 
25 Ausgangswert wird konstant gehalten, solange das BUFFER- 
Signal ahliegt. 

BUFINV: Der Wert des Ausgangssignals von BUFFO bzw.. BUFFI ist 
gleich demjenigen analogen. Eingangssignal, das anlag, als 
3.0 BUFFO bzw. BUFFI ein BUFFER-Signal von der CL 

erhielt. Der Ausgangswert wird konstant gehalten, solange das 
BUFFER-Signal anliegt. 
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INVERT: Das aktuelle analoge Eingangssignal von BUFFO bzw. 
BUFFI wird invertiert. 

5 PASS: BUFFO bzw. BUFFI schleift das aktuelle Eingangssignal 
unverandert durch. 

Das Ausgangssignal von BUFFO und das Ausgangssignal von BUFFI 
werden auf jeweils einen analogen Eingang der erweiterten 
10 analogen Verarbeitungseinheit XAPU der ECELL geftihrt. Alle 
Funktionen der APU einer SCELL sind in der XAPU einer ECELL 
enthalten. 

Im Gegensatz. zur APU der SCELL besitzt die XAPU zwei analoge 
Eingange, so dafi in der XAPU Operationen mit zwei analogen, 

15 zeitlich konstanten oder zeitlich veranderlichen Signalen 

moglich sind, insbesondere die Addition, Subtraktion, Multi- 
plikation und Division zweier solcher Signale. Es ist damit 
denkbar, die XAPU mittels eines analogen, zeitlich konstanten 
oder zeitlich veranderlichen Steuersignals zu programmieren, 

20 indent bestimmten Werten des Steuersignals bestimmte Funktio- 
nen zugewiesen werden. Daruberhinaus ist es denkbar, mit 
I 

exnem analogen Steuersignal der APU einen zur Ausubung einer 
Funktion notwendigen Parameter zu ubermitteln. Wenn bei- 
spielsweise f (t) ein analoges zeitlich veranderliches 

25 (Spannungs-) Signal ist, welches mit einem zeitlich verander- 
lichen (Spannungs-) Signal g(t) multipliziert werden soil, 
-kann die XAPU dann als Multiplikator nach Art eines span- 
nungs gesteuert en Verstarkers (Voltage Controlled Amplifier, 
VCA) nach Stand der Technik programitiiert werden, wobei f (t) 

30 an einem analogen Eingang der XAPU liegt, wShrend g(t) am an- 
deren analogen Eingang der XAPU liegt und das besagte 
Steuersignal darstellt. 
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Das Ausgangssignal der XAPU wird auf den Eingang der BIPS ge- 
fuhrt. Die BIPS der ECELL und' die BIPS der SCELL konnen 
gleich sein. Das Ausgangssignal der BIPS wird auf den Eingang 
5 des DeMUX geftihrt. Der DeMUX der ECELL und der DeMUX der 
SCELL konnen gleich sein. AuBerdem wird das Ausgangssignal 
der BIPS uber eine separate Leitung auf einen Eingang von 
MUXO sowie auf einen Eingang von MUX1 gefuhrt. 

10 Die Logiksektion kann ein Element zur Taktvervielf achung ent- 
halten, welches den Takt des DBUS vervielf acht , und das 
programmierbar sein kann. Damit kann die ECELL intern mit ei- 
nem Vielfachen des DBUS-Taktes operieren. 

15 Rekonfiguration einer Zelle (cellreconf iq) 

Das RECONREQ-Signal 

Die Analogsektion und die Logiksektion der Zelle sind bevor- 
zugt in der Weise strukturiert und verbunden, dafi die Zelle 

20 bei Eintreten bestiitimter Kriterien ein Signal , das RECONREQ- 
Signal, erzeugen kann, mit welchem sie ihre eigene Rekonfigu- 
ration oder die Rekonfiguration einer anderen oder mehrerer 
anderer Zellen veranlassen kann. Das RECONREQ-Signal kann .di- 
gital sein und uber ein separates digitales Bussystem 

25 weitergeleitet werden. Es kann aber auch analog sein und" uber 
ein separates analoges Bussystem weitergeleitet werden. 
Mit einem analogen . RECONREQ-Signal ist es moglich, neben den 
RECONREQ-Informationen noch zusatzliche Inf ormationen, zuiri 
Beispiel die Adresse der zu, rekonf igurierenden Zelle oder der 

30 zu rekonfigurierenden Zellen, gleichzeitig auf nur einer 
Busleitung zu ubertragen. 
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Kriterien, die ein RECONREQ - S i gna 1 auslosen, konnen zum Bei- 
spiel (aber nicht nur) sein: 



- Ein bestimmter Signalpegel, der von in der Zelle auftreten- 
den Analogsignalen (zu denen auch die analogen Eingangs- und 
Ausgangssignale zahlen) erreicht, uberschritten oder unter- 
schritten wird. 



- Eine bestimmte Signaldif f erenz, die zwischen in der Zelle 
10 auftretenden Analogsignalen (zu denen auch die analogen Ein- 
gangs- und Ausgangssignale zahlen) , erreicht, uberschritten 
oder unterschritten wird. 



- Eine bestimmte zeitliche Anderung eines Signalpegels, die 
15 von in der Zelle auftretenden Analogsignalen (zu denen auch 

die analogen Eingangs- und Ausgangssignale zahlen) erreicht, 
uberschritten oder unterschritten wird. 

- Das Verstreichen einer bestimmten Zeitspanne. 

20 

- Das Auftreten eines bestimmten digitalen Signals oder einer 
bestimmten Kombination digitaler Signale in 'tier Zelle oder an 
den digitalen Eingangen und/oder Ausgangen der Zelle. 

25 Die in der obicjen Auflistung genannten Signale konnen aus- 

drucklich auch von anderen Zellen oder weiteren Elementen des 
RAPs s.tammen. AuJierdem konnen durch logische Verknupfung 
(AND, OR, NAND, NOR, XOR usw. ) der genannten Kriterien weite- 
re Kriterien gebildet werden. Die Logiksektion der ECELL 

30 enthalt zur logischen Verknupfung von Kriterien geeignete 
Strukturen, zB fur Ergebnisvergleich, Flags einer ALU wie 
Ubertrag einer arithmetischen Einheit (carry etc) 
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Die Kriterien zur Bildung eines RECONREQ-Signals werden in 
der CL der Zelle ausgewertet . ' Die CL der Zelle generiert aus 
diesen Kriterien ein digitales Wort (RECONREQ-Wort) mit den 
5 notigen RECONREQ-Inf ormationen . 

Dieses RECONREQ-Wort kann in digitaler oder analoger Form von 
der Zelle weitergegeben werden. Dafur stehen eigene Bussyste- 
me (RECONREQ-Bus) , ein digitaler Bus und ein analoger Bus, 
zur Verfugung. 

10 

Soil das RECONREQ-Wort in- analoger Form weitergegeben werden, 
so wird das digitale RECONREQ-Wort in einem Digital-Analog- 
Umsetzer (DAC) in analoge Form gebracht. Jede Zelle kann zu 
diesem Zweck einen solchen DAC besitzen. 

15 

Die Daten, die zur Rekonf igurierung der Zelle notwendig sind, 
stellen eine dafiir geeignete Struktur zur Verfugung. Diese 
Struktur kann beispielsweise eine Ladelogik und eine Swit- 
ching-Tabelle sein, wie sie in Patentanmeldung DE196 54 
20 84 6.2 beschrieben sind. 

Die Ladelogik 

Die Ladelogik (LL) ist £ine Struktur, die nach einem 
25 RECONREQ- Signal die Rekonf iguration der betreffenden Zelle 

Oder der betreffenden Zellen durchfuhrt. Mehrere Zellen ste- 
hen mit jeweils einer einzigen LL'uber den RECONREQ-Bus in 
Verbindung. Diese Zellen bilden mit der zugehorigen LL einen- 
Cluster. Jede Zelle eines Clusters kann ein RECONREQ- S igna 1 
30. an ihre LL absetzen und so jede Zelle desselben Clusters zur 
Rekonf iguration auffordern. Andere Moglichkeiten, eine Rekon- 
f iguration anderer Zellen auszulosen', bestehen gleichfalls. 
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Verwiesen wird auf die o.g. Schriften und weitere Schriften 
der vorliegenden Anmelderin. Ein Baustein kann mehrere Clu- 
ster enthalten. Die LLs diesef Cluster stehen untereinander 
uber ein Bussystem in Verbindung und konnen somit Informatio- 
nen austauschen. Solche Inf ormationen konnen insbesondere 
Adressen von umzukonf igurierenden Zellen sein. Dadurch ist es 
jeder beliebigen Zelle des RAPs moglich, jede beliebige Zelle 
des RAPs zur .Rekonf iguration auf zuf ordern. 



Die LL kann entsprechend PACT__SWT (vergl. zitierte Patentan- 
meldung) aufgebaut sein und kann damit digitale RECONREQ- 
Worte direkt verarbeiten. Die LL benotigt ftir die Verarbei- 
tung eines analogen RECONREQ-Wortes jedoch analoge 
Vorstufen, namlich eine analoge Selektierstuf e (ASELSTAGE) 
und eine Analog-Digital-Wandlerstuf e (ADC) . Die Aufgabe der 
ASELSTAGE ist es, zu prufen, ob und an welchem analogen 
RECONREQ-Bus ein RECONREQ- Signal anliegt. Ist ein RECONREQ- 
Signal auf einem analogen RECONREQ-Bus vorhanden, so wird 
dieser Bus von der ASELSTAGE selektiert und zur weiteren 
Verarbeitung auf den ADC geschaltet, welcher das analoge 
RECONREQ-Wort in ein digitales RECONREQ-Wort zuruckwandelt , 
das von der LL verarbeitet werden kann. 

Die ASELSTAGE kann auf verschied^ne Arten realisiert werden. 
Eine Moglichkeit ist die Verwendiing eines Multiplexers, eine 
andere die Vferwendung eines Arbiters. 

ASELSTAGE als Multiplexer. Die analogen RECONREQ-Busse der 
von der LL iiberwachten Zellen liegen an den Eingangen eines 
getakteten Analogmultiplexers nach Stand der Technik. Bei je- 
dem Takt wird der Multiplexer urn einen Eingang 
weitergeschaltet, so dali bei jedem Takt ein anderer Bus am 
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Ausgang des Multiplexers liegt. Ein Komparator uberwacht den 
Ausgang des Multiplexers. Wenn kein analoges RECONREQ-Signal 
am Ausgang des Multiplexers liegt, hat der Ausgang des Multi- 
plexers einen bestimmten Pegel, beispielsweise 0 Volt. Liegt 
5 ein RECONREQ-Signal an, liegt ein anderer Pegel am Ausgang 
des Multiplexers, was den Komparator dazu veranlallt, das 
RECONREQ-Signal auf den nachf olgenden ADC zu schalten. Al- 
ternativ und/oder zusatzlich konnen' mehrere Komparatoren 
vorgesehen sein, die das Signal mit unterschiedlichen Si- 
10 gnalpegeln vergleichen und so unmittelbar eine Auswertung 

bewirken. Dies bietet sich insbesondere an, .wenn ,nur,.wenige 
Signalstufen zu unterscheiden sind. 

AS EL STAGE als Arbiter, Die analogen RECONREQ-Busse der Zellen 
15 eines Clusters werden zunachst auf die Eingange eines analo- 
gen Multiplexers (AMUX) gefuhrt. Liegt an einem der analogen 
RECONREQ-Busse ein RECONREQ-Signal an, so wird dieser Bus 
durch den AMUX selektier und das anliegende RECONREQ-Wort auf 
den Ausgang des AMUX geschaltet. 

20 

Bus syst erne 

Ein RAP enthalt" bevorzugt zumindest zwei voneinander unaibhan- 
gige, flexible Bussysteme zur Vernetzung der einzelnen Zellen 
und zur Verbindung des RAPs mit der AuBenwelt. Die bevorzug- 

25 ten Bussysteme konnen konfiguriert und wahrend der Laufzeit 
rekonf iguriert werden, ohne dafi die Tatigkeit des RAP unter- 
brochen werden muB. Die Bussysteme konnen mit Eigenschaf ten 
ausgestattet sein, wie sie in Patentanmeldung DE 197 04 742.4 
beschrieben sind. Unterschieden wird hier das analoge Bussy- 

30 stem und das digitale Bussystem. 

Das analoge Bussystem (ABUS) 
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Das analoge Bussystem ABUS dient cier Obermittlung der zu be- 
arbeitenden, bereits bearbeiteten oder neu erzeugten analogen 
Daten und analogen Signale von aufien an die Zellen und/oder 
zwischen den Zellen. Insbesondere ist es mit deiu ABUS mog- 
5 lich f Zellen zu kaskadieren, urn auf diese Weise ein analoges 
Signal in mehreren auf einanderf olgenden Operationen zu bear- 
beiten, wobei eine Operation von jeweils einer Zelle 
durchgefuhrt wird. 

Der ABUS kann mit jeder seiner Leitungen mehrere, insbesonde- 
10 re mehr als zwei Inf ormationen gleichzeitig ubertragen, zum 
Beispiel 256 Inf ormationen. ' Der ABUS kann mit einer festen 
oder variablen Frequenz getaktet sein oder asynchron, das 
heifit nicht getaktet, sein. Die Implement ierung des ABUS kann 
in einer Art und Weise erfolgen, wie sie in Patentanmeldung 
15 DE 197 04 742.4 beschrieben ist. 

Das dig! tale Bussystem (DBUS) 

Neben dem ABUS existiert auf dem RAP ein zweites Bussystem, 
genannt DBUS . 

20 Der DBUS ist getaktet und dient der Distribution digitaler 
Daten, beispielsweise Konf igurationsdaten und Statusdaten, 
zwischen den Zellen. Die Logiksektion jeder Zelle ist an den 
DBUS angeschlossen. Die Implementierung des DBUS kann in ei- 
ner Art und Weise erfolgen, wie sie in Patentanmeldung 

25 DE 197 04 742.4 beschrieben ist. 

Dieser Aspekt der Erfindung wirdmit Bezug auf die Zeichnung 
nachfolgend besipielhaft erlautert, wobei dargestellt ist 
durch 

30 Figur Bl zeigt den.Aufbau einer einfachen Zelle 

Figur B2 zeigt den Aufbau einer erweiterten Zelle 
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Figur B3 zeigt eine mogliche Art der Realisierung von BUFFO 
bzw. BUFFI 

Figur B4 zeigt, wie beispielsweise der Ausdruck f(t) A g(t) be- 
rechnet werden kann. 

5 

Figur 1 zeigt den Aufbau einer einfachen Zelle (SCELL) .Sie 
besteht aus der Digitalsektion (0101) und der Analogsektion 
(0102) . Zentrales Element der Logiksektion ist die Steuerlo- 
10 gik CL (0110) , die tiber den DBUS (0130) mit anderen Zellen, 
zusatzlichen Strukturen . wie beispielsweise einer Ladelogik 
und/oder einer Switching-Tabelle, wie sie in Patentanmeldung 
DE 196 54 846.2 beschrieben sind, und/oder der Aufienwelt kom- 
munizieren kann. 

15 

Der Multiplexer MUX0 (0121) ist an den ABUS (0131) ange- 
schlossen. Sofern ein Analogsignal von der SCELL zu 
verarbeiten ist, selektiert MUX0 (0121), uber die Leitungen 
(0141) von der Steuerlogik CL (0101) oder einer anderen ge- 

20 eigneten Struktur gesteuert, diejenige Leitung des ABUS 

(0131), auf der das zu verarbeitende Analogsignal anliegt. 
Der Ausgang von MUX0 (0121) ist tiber' die Leitung 014 6 mit 
der analogen Verarbeitungseinheit APU (0120) verbunden. In 
• ihr wird das von MUX0 selektierte Signal verarbeitet, sofern 

25 ein Signal selektiert wurde, oder die APU generiert ein Si- 
gnal, welches ein RECONREQ-Signal sein kann, oder die APU 
verharrt in einem vordef inierten Ruhezustand. Das Verhalten 
der APU wird von der CL (0101) uber die Leitungen 0143 ge- 
steuert. Diese Leitungen (0143). konnen bidirektio.nal 

30 ausgefuhrt sein, so daii die APU in der Lage ist, abhangig von 
bestimmten Ereignissen und Kriterien Signale an die CL (0101) 
zu schicken. Die Kriterien konnen solche sein, die bei- 
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spielsweise auch zur Erzeugung eines RECONREQ- Signals fuhren. 
Ein erzeugtes Signal kann insbesondere ein RECONREQ-Signal, 
wie in Abschnitt cellreconfig beschrieben, sein. Das von der 
APU verarbeitete oder erzeugte Signal gelangt uber die Lei- 
5 tung 0149 auf eine Speicherstuf e BIPS (0124), deren Funktion 
von der CL (0101) gesteuert wird. Dabei stehen die in Ab- 
schnitt scell beschriebenen Funktionen BUFNONINV, BUFINV, 
INVERT, PASS, 3 STATE zur Verfugung. Am Ausgang der BIPS wird 
das Analogsignal von einem Demultiplexer DeMUX (0125) tiber- 
10 nommen, der es, gesteuert von der CL uber Leitung 0145 oder 
einer anderen- geeigneten Struktur, auf den ABUS 0131 schal- 
tet . 



Die Logiksektion (0101) der SCELL besteht aus der CL (0110) 
15 und der LOGUNIT (0111), die uber die Leitung 0140 miteinander 
in Verbindung stehen. 



Figur 2 zeigt den Aufbau einer erweiterten Zelle (ECELL) . 
Sie ist funktionell unterteilt in eine Analogsektion (0202) 
20 und eine Logiksektion (0201). Die analogen Multiplexer MUX0 
(0221) und MUX1 (0222) selektieren, gesteuert von der CL 
(0210) der ECELL, die beiden Analogsignale, die von der ECELL 
verarbeitet werden sollen. MUX0 selektiert dabei das erste 
Analogsignal, MUX1 selektiert das zweite Analogsignal. Fur 
25 die Herkunft der beiden zu verarbeitenden Analogsignale gibt 
es drei Moglichkeiten. 

Entwedex stammt das erste und/oder das zweite Analogsignal. 
vom ABUS, oder das erste und/oder das- zweite Analogsignal 
sind identisch mit der festen Massebezugsspannung GND, oder 
30 das erste und/oder das zweite Analogsignal sind identisch mit 
dem Ausgangssignal der BIPS (0225), welches mittels der Lei- 
tung 0252 auf. jeweils. einen Eingang von MUX0 und MUX1 
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zuriickgefuhrt wird. Das erste Analogsignal gelangt von MUXO 
uber die Leitung 0246 auf BUFFO (0223). Das zweite Analogsi- 
gnal gelangt von MDX1 uber die Leitung 0247 auf BUFFI (0224). 
Die beiden Analogsignale konnen in BUFFO bzw. BUFFI gemafi den 
5 in Abschnitt uber die Ecell beschriebenen Betriebsarten von 
BUFFO und BUFFI verandert werden. BUFFO und BUFFI konnen uber 
die Leitung 0242 unabhangig voneinander durch die CL (0210) 
gesteuert werden. Das analoge Ausgangssignal von BUFFO (0223) 
gelangt uber die Leitung 0248 auf den ersten Analogeingang 

10 der XAPU (0220) . Das analoge Ausgangssignal von BUFFI (0224) 
gelangt uber die Leitung 0249 auf den zweiten Analogeingang 
der XAPU (0220). Die XAPU (0220) verarbeitet die beiden ana- 
logen Eingangssignale zu einem analogen Ausgangssignal gemafi 
der durch die CL (0210) uber die Leitung 0243 programmierten 

15 Funktion, wie in Abschnitt EcbII beschrieben. Das analoge 

Ausgangssignal der XAPU (0220) wird mittels der Leitung 0250 
an eine weitere Speicherstuf e (BIPS, 0225) ubertragen. Die 
BIPS der ECELL und die BIPS der SCELL konnen gleich sein. 
Die Funktion der BIPS (0225) wird von der CL (0210) durch die 

20 Leitung 0244 gesteuert. Das analoge Ausgangssignal der BIPS' 
wird durch die Leitung 0251 auf den Demultiplexer (DeMUX, 
0226) ubertragen, der das Signal auf den ABUS (0231) auf- 
schaltet. Der DeMUX wird von der CL (0210) gesteuert. 

25 Die Logiksektion (0201) der ECELL besteht aus einer vollstan- 
digen Logiksektion, wie sie in einer SCELL zu finden ist, 
also der CL (0210) und der LOGUNIT (0211), die uber die Lei- 
tung (0240) miteinander in Verbindung stehen. Die 
Logiksektion der ECELL ist daruberhinaus in der Lage, die 

30 XAPU (0120) mit ihrem gegenttber der APU einer SCELL erweiter- 
ten Funktionsumfahg zu steuern und zu verwalten. 
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Beispielsweise logische Operationen wie beispielsweise NAND/ ' 
NOR, AND, OR, XOR ermoglichen. Eingangsvariablen solcher Ope- 
rationen konnen solche Kriterien sein, die auch zur Bildung 
eines RECONREQ- Signals fiihren, aber auch digitale Signale, 
5 die eigens dafur erzeugt werden. 

Figur 3 zeigt eine mogliche Art der Realisierung von BUFFO 
bzw.\ BUFFI. ,OP0 ist ein Operationsverstarker, der so be- 
schaltet ist, daft er das am Eingang IN liegende analoge 

10 Signal wahlweise invertiert oder durchschleif t . Die Betriebs- 
art wird durch DeMUXO ausgewahlt. Wenn • am. S.teuereingang 
NONINV INV eine logische 0 liegt, wird das Eingangssignal 
durchgeschleift, wenn am Steuereingang NONINV INV eine logi- 
•sche 1 liegt, wird das Eingangssignal invertiert- Ober DeMUXl 

15 wird entschieden, ob das Signal im Kondensator C zwischenge- 
speichert wird (BUFFER) , oder ob es ohne Zwischenspeicherung 
am Ausgang OUT von OP1 zur Verfugung steht (PASS) • Zwischen- 
speicherung erfolgt, wenn der Steuereingang BUFF PASS eine 
logische 0 erhalt. 

20 Keine Zwischenspeicherung erfolgt, wenn der Steuereingang 
BUFF PASS eine logische 1 erhalt. 

Figur 4 zeigt, wie beispielsweise der Ausdruck f(t) A g(t) be- 

25 rechnet werden kann. 

Dazu wird in der ersten Zelle f (t) logarithmiert , das bedeu- 
tet f von f (t) wird der Logarithmus zur beliebigen, aber 
festen Basis a gebildet. Dazu kann eine SCELL- dienen, die als 
Logarithmierer konfiguriert ist. Das Ergebnis dieser Operati- 

30 on wird in der zweiten Zelle mit g(t) multipliziert Dazu 
kann eine ECELL dienen, die beide Signale nach Art eines 
spannungsgesteuerten Verstarkers miteinander multipliziert. 
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In der dritten Zelle wird die Basis a mit dem Ergebnis der 
Multiplikationsoperation potenziert. Dazu kann eine SCELL 
dienen, die als Delogarithmierer konfiguriert ist. Das Ergeb- 
nis der Delogarithmierungsoperation entspricht dem Ausdruck 
5 (Cf (t)] A {g(t)}. 

Vorstehend wurde beschrieben, wie eine Einheit mit konfigu- 
rierbaren analogen Einheiten aufgebaut werden kann. Es wurde 
vorgeschlagen, analoge Signale fur Arbeiten mit Zellen so 

10 auszubilden, dass sie im Betrieb anderer Zellen rekonfigu- 
rierbar sind und es wurde vorgeschlagen, ihnen dafur eine 
geeignete Beschaltung zuzuordnen. Es ist nun einzuschatzen, 
dass die MSglichkeit besteht, einen Baustein zu bilden, bei 
welchem eine Signalverarbeitung sowohl analog als auch digi- 

15 tal erfolgt. Es ist dann moglich, die digitale 

Signalverarbeitung gleichfalls mit rekonf igurierbaren Bauele- 
menten vorzusehen, etwa durch ein multidimentionales Feld 
rekonf igurierbarer digitaler Einheiten, wie es in den ver- 
schiedenen Patentanmeldungen des vorliegenden Anmelders 

20 beschrieben wurde. Urn die erforderiiche Wandlung vorzusehen, 
konnen einzelne oder mehrere Umsetzerstuf en vorgesehen sein, 
d. h. ein oder mehrere Analog-Digital7Wandler und erforderli- 
chenfalls mehrere Digital-Ahalog-Wandler . Oberdies ist es 
moglich, versehiedene Wandlerverf ahren einzusetzen und die 

25 Genauigkeit der Wandlung bei Vorsehen mehrerer Wandlereinhei- 
ten unterschiedlich zu gestalten. Gleichfalls ist es moglich, 
neben einfachen logischen Schaltungen, die einem Analogele- 
ment ziigeordnet werden, auch komplexere Logik-und 
Funktionskreise vorgesehen werden konnen. 

30 

Es wird einzuschatzen sein, dass die Vielzahl der Analogele- 
mente, Busse usw. sowie der gegebenenfalls erforderlichen 
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Wandlereinheiten einem jeweiligen Zweck ohne weiteres anpass- 
bar sind, etwa urn Hochf requenzanwendungen zu genugen oder, 
bei Niederfrequentenanwendung£n, eine extreme Rauscharmut 
bzw. ein sehr gutes Signal- Rauschverhaltnis vorzusehen. 

5 

Es sei weiter erwahnt, daJi bevorzugt die digitalen und analo- 
gen Elemente gemischt werden, insbesondere auf ein und 
demselben IC. Dazu kann in einem gemischtne Feld vermittels 
eines oder mehrer ADCs und/oder DACs und/oder Komparatoren 

10 ein Ubergangsmittel vorgesehen werden. Dies ist vorteilhaft, 
well etwa im Bereich Software defined Radio die rein digitale 
Abarbeitung der ankommenden hochf requenten schwachen Anten- 
nensignale noch problematisch ist, wobei trotzdem auch 
beziiglich der analogen Signalbe- und/oder -verarbeitung eine 

15 grofie Wahlfreiheit erwiinscht ist- 

Die Erfindung betrifft weiter Vorrichtungen und Verfahren zur 
Verbesserung des Transfers von Daten innerhalb von mehrdimen- 
sionalen Anordnungen von Sendern und Empfangern bzw. -zellen. 
20 Dafi diese gerade in kritischen Applikationen wie Software de- 
fined Radio besonders relevant ist, sei erwahnt. 

Die Zellen von etwa multidimensionalen Prozessorf eldern kon- 
nen nun unterschiedlichen Funktionen ausfuhren, etwa 
25 Bool^sche Verknupf ungen von Eingangs-Operanden bewirken, 

Zwisehen ihnen verlaufen Verbindungen, die gleichfalls ein- 
stellbar sind, typisch etwa Busse, die auf verschiedene Weise 
eine Vernetzung bewirken konnen und so ein in seiner Vernet- 
30 zung- einstellbares multidimensionales Feld aufbauen. OBer die 
Busse oder anderen Leitungen tauschen die Zellen miteinander 
wie erforderlich Informationen aust, etwa Statussignale, 
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Trigger Oder die zu verarbeitenden Daten. Typisch sind dabei 
in einem zweidimensionalen Prozessorf eld etwa die Zellen Rei- 
hen- und spaltenweise angeordriet, wobei die Ausgange von 
Zellen einer ersten Reihe auf Busse gefiihrt, an die zugleich 
5 die Eingange der Zellen der nachsten Reihe zu koppeln sind. 
Bei einer bekannten Anordnung (Pact XPP) sind zudem Vorwarts- 
und Ruckwartsregister vorgesehen, urn Daten unter Umgehung von 
Zellen auf Bussysteme anderer Reihen zu leiten, ein Balancing 
von parallel auszufiihrenden Zweigen zu erreichen, usw. Es ist 
10 auch schon vorgeschlagen worden, derartige Vor- und/oder 
. Ruckwartsregister mit einer ttber den reinen Datentransf er 
hinausgehenden Funktionalitat zu versehen. 

Urn eine bestinimte Art der Datenverarbeitung durchzuf iihren, 
15 muil jeder Zelle eine bestimmte Funktion zugewiesen werden und 
es ist eine geeignete Vernetzung vorzusehen. Es mufi dazu, be- 
vor das multidimensionale Prozessorf eld Daten wie gewunscht 
verarbeitet, festgelegt werden, welche Zelle welche Funktion 
ausfuhren soli, es ist fur jede an einer Datenverarbeitungs- . 
20 aufgabe beteiligen Zelle eine Funktion festzulegen und es mufi 
die Vernetzung bestimmt werden, Dabei ist es wunschenswert, 
. die Funktion und Vernetzung so zu walilen, dafi die Datenverar-. 
beitung moglichst ziigig erfolgen kann. Oftmals ist es .jedoch 
nicht moglich, eine Konf iguration zu f'inden, die den ge- 
25 wunschten Datentransf er in optimaler Weise gewahrleistet . Es 
mussen dann suboptimale Konf igurationen yerwendet werden. 

Wunschenswert ist es hier, eine Moglichkeit zu schaffen, die 
Konfigurierbarkeit zu erleichtern. 

30 

Es wird dabei weiter vorgeschlagen, dafi bei ^inem multidimen- 
sionalen Prozessorf eld aufweisend eine Vielzahl benachbart 
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angeordneter Datenverarbeitungszellen mit Eingangen, die Da- 
ten von Vernetzungswegen erhalten, einer Operanden- 
Verkniipfungseinheit, die diese entsprechend der jeweiligen 
Funktion ihrer Operanden-Verkntipf ungseinheit verknupfen und 
5 Ausgangen, urn die Daten verkntipft auf Vernetzungswege aufzu- 
geben, vorgesehen is't, dafi die Datenverarbeitungszellen ein 
Aspektverhaltnis aufweisen, das wenigstens 1,5:1, bevorzugt 
2:1 betragt. Dies ermoglicht das bevorzugte Pipelining in den 
PAEs und/oder den Bussen. Dabei ist es bevorzugt, aber nicht 
10 zwingend, in insbesondere jeder PAE ein eigenes Pipelining 
vorzusehen, was Takterhohungen ermoglicht 

Damit wird eine wesentliche Verbesserung der Verkmipfbarkeit 
erreicht, ohne dafi teuere Siliziumf lache far zusatzliche Bus- 

15 verbindungen bereitgestellt werden mufi oder eine besodners 

komplexe Topologie gewahlt werden mufi. Die Verbesserungen der 
Verbindbarkeit ergeben sich vielmehr allein daraus, daJJ der 
Datentransfer quer zu den Zellen verkurzt wird und damit Da- 
ten innnerhalb kurzerer Zeiten, bezogen auf die zum 

20 durchstromen bzw. Verarbeiten in der Zelle erf orderlichen 

Zeiten selbst, von Zelle zu Zelle gelangen. Damit wachst die 
Anzahl der nocfcr als . nachste Nachbarn zu bezeichnenden Zellen, 
die also noch innerhalb eines Taktes zu erreichen sind. Es 
prgibt sich etwa bei zweidimensionalen Feldern eine Anord- 

25 nung, bei der eine Zelle funktional mehr nachste Nachbarn 

besitzt, als sich topologisch bei reiner Geometriebetrachtung 
im zweidimensionalen Fall ergibt. Mit andern Worten ergibt 
sich nur durch die Veranderung des Aspektverhaltnisses funk- 
tional eine mehr als zweidimensionale Konnektivitat . 



30 



Bei den Zellen wird es sich insbesondere urn PAE-Zellen mit 
EALU handeln, wie sie per se aus dem vorzitierten Stand der 
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Technik bekannt sind. Bei solchen Zellen wird es sich wie be- 
vorzugt uiti grobgranular konf igurierbare Zellen handeln. 

Es ist moglich und bevorzugt, wenn die Datenverarbeitungszel- 
5 len in Reihen und Spalten angeordnet sind. Dies erlaubt eine 
besonders giinstige Auslegung der Zellen, die typisch nahe- 
rungsweise trapezf ormig bzw. rechteckig sind. Es kann dann 
vorgesehen sein, daii zumindest bei einem Teil der Datenverar- 
beitungs zellen Dateneingange vorgesehen sind, urn von einer 
10 oberen Reihe Daten zu erhalten und Datenausgange, urn an eine 
untere Reihe Daten . auszugeben. .In. einem solchen Fall ergibt 
sich die verbesserte Konnektivitat in beiden Reihen. 

Typisch wird es sich urn ein Prozessorf eld handeln, bei dem 
15 die Datenverarbeitungseinheiten EALUs, ALU und/oder register- 
flankierte Zellen sind, d.h. es werden zur Verbindung 
unterschiedlicher Reihen typisch neben den datenverarbeiten- 
den und dabei Daten verzogerungsf rei, d.h. etwa 
schnellstmoglich weiterleitenden Zellen noch Register vorhan- 
20 den sein, die gerade dazu dienen, Daten bei der Weiterleitung 
zu verzogern, sei es, um unkontrollierte Riickkopplungsschlei- 
fen zu verhindern. bzw. unterbrechen (Prinzip der sog. 
Annihilated Feedback Loop Termination- sog. AFT ER- Z e 1 1 en.) 
oder bei datenauf spaltendem Durchlaufen von Zweigen und nach- 
25 folgendem Wiedervereinigen einen zeitlichen Gleichlauf zu 
. erzwingen (Balancing) . 

Mit einem solchen Prozessorf eld ist es nun tnoglich, eine Kon- 
figuration derart zu wahlen, daB, wenn Zellen ftir die 
30 Konfiguration ausgewahlt und in Funktion und Vernetzung be- 
st immt werden, wobei eine Vernetzung derart bestimmt wird, 
dafi Daten von Zelle zu Zelle zumindest weitgehend verzoge- 
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rungsfrei ubertragbar sind, vorgesehen ist, dafi als benach- 
barte Zellen, zwischen denen Daten binnen eines Taktes oder 
einer geringen Taktzahl ubertragbar sind, auch solche bertick- 
sichtigt werden, die nicht unmittelbar nebeneinander liegen, 
5 sondern in der Breite durch eine Strecke getrennt sind, die 
geringer ist als die Lange der Zelle. Dafi eine Heruntertak- 
tung der Zellen im Vergleich zu den Bussen per se moglich 
ist, sei als ,bevorzugt offenbart. Of f ensichtlich kann aber 
auch in Ausnahmef alien eine in die andere Richtung gehende 
10 Taktabweichung erfolgen oder auf eine solche verzichtet wer- 
den. 

Es sei darauf hingewiesen, dafi das angegebene minimale 
Aspektverhaltnis das wenigstens 1,5:1 betragt, bevorzugt noch 
15 grofiere Werte annimmt und sich bei sorgf altiger Auslegung der 
Einheiten durchaus im Bereich zwischen 5:1 und 10:1 bewegen 
kann. 

Die Erfindung wird im folgenden anhand der Zeichnung be- 
2.0 schrieben, worin gezeigt ist durch 

Fig. CI ein Prozessorf eld der vorlxegenden Erfindung 



25 Nach Fig. 1 umfaBt ein allgemein mit 1 bezeichnetes Prozes- 
sorfeld 1 eine Vielzahl benachbart angeordneter 

i 

Datenverarbeitungs zellen 2 mit Eingangen 3, die Daten von 
Vernetzungswegen 4 erhalten, einer Operanden- 
Verkniipfungseinheit 5, die diese entsprechend der jeweiligen 
30 Funktion ihrer Operanden-Verknupf ungseinheit 5 verknupfen und 
Ausgangen 6, urn die Daten verknupft auf Vernetzungswege 4 
aufzugeben, wobei die Datenverarbeitungs zellen bzw. ihre da- 
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tendurchf lossene Operanden-Verknupf ungseinheit 5 ein Aspekt- 
verhaltnis von Lange zu Breite aufweisen, das grofier ist als 
2:1 betragt. 

5 Bei dem Prozessorf eld 1 handelt es sich vorliegend urn eine 

per se als XPP bekantnte Anordnung; alternativ kann es als ein 
Array aus zur Laufzeit partiell rekonf igurierbaren Elementen 
angeordnet sein konnen, etwa als Prozessor, Koprozessor, DSP, 
usw.. Das Prozesssorfeld ist im dargestellten Fall aus 3 Rei- 
10 hen und 4 Spalten aufgebaut, aber nur aus Griinden der 

Obersichtlichkeit so vergleichsweise klein gewahlt. Typisch 
wird es grofier ausgelegt werden. 

Die Datenverarbeitungszellen 2 sind grobgranular konfigurier- 
15 bar und weisen f eingranulare Statemachines auf . Sie sind auf 
per se bekannte Weise rekonf igurierbar, ohne den Betrieb zu 
storen. Auf die hier realisierte, aber nicht naher zu erlau- 
ternde Moglichkeit der zentralen Konf igurationsvorgabe etwa 
durch einen Konf igurationsmanager , der Waverekonf iguration 
20 etc. sei hingewiesen. Die Zellen enthalten als Operanden- 

Verkniipfungseinheit 5 eine ALU-Einheit r in der arithmetische 
Operatidnen wie Addition, Multiplikation, Subtraktion urid Di- 
vision an bis zu drei eingehenden Operanden durchgefiihrt 
werden konnen, sowie Verknupf ungen wie ISTgrofier? ISTkleiner? 
25 IStNUll? sowie XOR, OR f AND NAND etc. Die ALU-Einheit ist 

mittig angeordnet und flankiert von einem Vorwarts- und einem 
Riickwartsregister, die in per se bekannter Weise uber die An- 
schlusse der Datenverarbeitungszelle 2 gleichfalls mit den 
Vernetzungswegen 4 verbunden werden konnen. 



30 



Die Datenein- und ausgange 3 bzw 6 sind uber Multiplexer mit 
den Verbindungswegen 4 verbunden. Es ist im vorliegenden Fall 
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ein Bussystem mit einer Vielzahl von Leitungen vorgesehen, urn 
die Zellen in den Reihen und Spalten konf igurierbar miteinan- 
der zu vernetzen. 

5 Das Aspektverhaltnis der ALU-Einheit betragt nun im darge- 
stellten Beispiel 6:1, d.h. die Zelle ist sehr viel langer 
als breit. 

Die Anordnung wird nun verwendet wie folgt: 

10 

Es wird zunachst ein Programm zur Ausfuhriing auf dem Array 1 
ausgewahlt. Dann wird mit per se bekannten Mitteln eine Kon- 
figuration bestimmt, die einen optimalen Daten-Durchsatz 
erlaubt. Hierbei wird nun beriicksichtigt , dafi Daten auch an 

15 Zellen, die nicht unmittelbar in der Reihe darunter oder 
seitlich neben einer gegebenen Zelle liegen, sondern z.B. 
drei Spalten seitlich versetzt sind, innerhalb eines Verar- 
beitungs-Taktes Daten erhalten konnen, ohne dali groflere 
Verzogerungen auftreten. Die unter Berucksichtigung dieser 

20 erweiterten Nachste-Nachbar-Def inition erhaltene Konfigurati- 
on wird auf das Array auf konf iguriert und ausgefiihrt. 

Die vorliegende Erfindung befasst siqh aber nicht nur mit dem 
25 vorteilhaften Aufbau eines multidimeilsionalen Feldes rekonfi- 
gurierbarer Elemente wie bei rekonf igurierbaren. Prozessoren, 
sondern auch mit Verfahren zu deren Betrieb, etwa derart, dali 
eine Obersetzung einer klassischen Hochsprache (PROGRAMM) wie 
Pascal, C, C++, Java etc. auf eine rekonf igurierbare Archi- 
30 tektur ermoglicht wird. 
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Oftmals wird hier nicht das gesamte multidimensionale Feld 
rekonfigurierbarer Elemente samt aller zwischen den Daten 
handhabenden Elemten vorgesehenen Bussystemen f Verbindungs- 
leitungen usw. zur Umkonf iguration freigegeben, sondern es 
5 besteht vielmehr das Erfordernis, eine neue Aufgabe einem 

kleinen Teilbereich 'des multidimensionalen Feldes zuzuordnen. 
Es ist uberdies haufig nicht vorhersagbar, wie dieser Teilbe- 
reich beschaffen sein wird. Dies gilt insbesondere dann, wenn 
auf dem multidimensionalen Feld rekonfigurierbarer Elemente 
10 mehrere Aufgaben parallel abgearbeitet werden mussen, etwa im 
Wege des Multitasking, und/oder nicht vorhergesagt werden 
kann, warm dort, etwa bei Echtzeitanwendungen, welche Res- 
sourcen zwecks Umkonf iguration freigegeben werden. 

15 Prinzipiell besteht die Moglichkeit, einen Code, der auf dem 
multidimensionalen Feld rekonfigurierbarer Elemente abgear- 
beitet werden soli, zur Laufzeit zu ubersetzen, also erst 
dann, wenn die Abarbeitung anderer Aufgaben schon begonnen 
hat, festzulegen, wie der als nachstes auszuf uhrende Code be- 

20 stimmten rekonf igurierbaren Elementen zuzuordnen ist, wie die 
Verbindung zwischen diesen laufen soil, welche Zwischenspei- 
cherungen erf orderlich sind usw. Es" ist einsichtig, dass eine 
solche Vorgehensweise' zur Obersetzung einen vergleichsweise 
hohen momentanen Datenverarbeitungsaufwand erfordert. Gerade 

25 in kritischen Rechnerapplikationen, die ein HdjchstmaB an Re- 
' chenleistung erfordern, ist es gewunscht, fur eine solche 
Ubersetzung wahrend- der Laufzeit keine zusatzliche Rechenlei- 
stung zu verbrauchen. Es ist daher auch schon ublich, 
Programmcode vor Beginn des Programmes zu kompilieren und 

30 dann Teilkonf igurationen zu bestimmen, die jeweils in das 
Feld hinein konfiguriert werden, sobald dort entsprechende 
Ressourcen frei sind. 
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Ein Problem besteht allerdings darin, dass, gerade bei Echt- 
zeitanwendungen, im Vorfeld nicht feststeht, wie die jeweils 
verftigbaren Ressourcen angeordnet sind. Dies betrifft einer- 
5 seits die Funktionalitat der zur Datenhandhabung verfiigbaren 
Elemente, in die hiriein konfiguriert werden konnte, sofern 
nicht alle Daten handhabenden Elemente dieselbe Funktion be- 
sitzen. So ware denkbar, in einem multidimensionalen Feld 
rekonfigurierbarer Elemente verschiedene Zellen mit Rechen- 

10 werken auszustatten, die fur Flielikomma-Berechnungen 

ausgelegt sind, Elemente ■ vorzusehen, die. lediglich Bool'sche 
Daten handhaben, Elemente , die uber zugeordnete Speicher ver- 
fiigen, Elemente, mit oder in denen Sequenzer vorgesehen 
werden konnen usw. Hier ist eine Ausfiihrung mit Vorkompilie- 

15 rung darauf angewiesen, entweder mit der Omkonf iguration zu ' 
warten, bis genau jene Zellen zur Verfugung stehen, die die 
in der Vorkompilierung festgelegten Funktionen und Anordnun- 
gen besitzen. Auch muli bei der Vorkompilierung zudem der 
kleinste, alien Zellen gemeinsame Funktionsumf ang verwendet 

20 werden. Beides verschwendet Ressourcen. Zudem ist meist nicht 
klar, wie die fur die Umkonf iguration f reigegebenen Elemente 
angeordnet sind und welche Verbindungen verfugbar sind; 'auch 
dadurch wird gegebenenf alls die Hineinkonf iguration einer 
neuen Aufgabe (Task) massiv erschwert. 

25 

Das Problem wird noch gravierender, wenn grofie Bereiche des 
multidimensionalen Feldes f reigegeben werden und .prinzipiell 
die Moglichkelt und/oder der Zwang besteht, mehrere Konfigu- 
rationen fur unterschiedliche Aufgaben gleichzeitig in das 
30 Feld hinein zu konf igurieren. 
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Es wird somit gemafl. einem ersten wesentlichen Aspekt der Er- 
f indung ein Verfahren zum Betrieb eines multidiniensionalen 
Feldes rekonf igurierbarer Elemente vorgeschlagen, worin Grup- 
pen zusairtmen datenhandhabender Elemente in vorbestimmter 
Weise wahrend der Lauf zeit zur Abarbeitung vorgegebener Auf- 
gaben im Feld konf icfuriert werden und wobei vorgesehen ist, 
dass fur zumindest eine abzuarbeitende Aufgabe eine Mehrzahl 
von solchen Elementgruppenanordnungen im multidimensionalen 
Feld bestimmt wird, die zur Abarbeitung der vorgegebenen Auf- 
gabe geeignet sind, fur die Abarbeitung der vorgegebenen 
Aufgabe eine dann besonders geeignete Elementgruppenanordnung 
aus der Mehrzahl ausgewahlt wird und die ausgewahlte Anord- 
nuhg in das Feld hinein konfiguriert wird. 

Die Erf indung schlagt somit vor, bei der Vorbereitung der ei- 
gentlichen Datenverarbeitung eine Vielzahl von Anordnungen 
bzw. Konf igurationen vorherzubestimmen und dann aus den vor- 
bestimmten Elementgruppenanordnungen eine solche auszuwahlen, 
die fur die Abarbeitung der vorgegebenen Aufgabe bei den dann 
gegebenen Feldressourcen besonders gut geeignet ist. Damit 
ist eine wesentliche Verbesserung im Betrieb eines multidi- 
mensionalen Feldes rekonf igurierbarer Elemente im 
Wesentlichen durch eine einfache Erweiterung des Compilers 
gegeben f mit dem die zuvor programmierten Codes dbersetzt 
werden, und zwar dadurch, dass dieser nicht nur eine einzige 
Konf iguration fur eine gegebehe Aufgabe bestimmt, sondern 
mehrere solcher Konf igurationen und somit ausnutzt, dass kei- 
ne eindeutige LSsung fiir das Problem besteht, ein Stuck 
gegebenen Hochsprachecode auf ein multidimensionales Feld re- 
konf igurierbarer Elemente zu Ubersetzen- Es sei erwahnt, dali 
hier der Begrif f xx Compiler" verwendet wird fur ein Mittel, 
das Konf ickurationen bestimmt,. unabhangig davon, ob es sich 
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um einen Routerteil, einen Obersetzerteil oder einen anderen 
Teil eines Mittels zur Konf igurationsbestimmung anhand von 
Programmcodes handelt. Dieses ' Mittel kann mittels Festver- 
drahtung, d. h. als Hardware oder als Softwareprogramm 
5 realisiert sein. 

Es ist moglich, aus dieser Vielzahl von potentiell moglichen 
Konf igurationen, die zur Abarbeitung eines gegebenen Stuck- 
Codes moglich sind, eine Auswahl anhand der Geometrie zu 

10 treffen, die diese Element gruppenanordnung im Vergleich zu 

jener besitzt, .die /die im Multidimensionalen Feld fur die Um- 
konf iguration verfugbaren bzw. vermutlich bald verfiigbar 
werdenden Elemente besitzen. So kann durch einen einfachen 
Mustervergleich versucht werden, eine Konf iguration, d. h. 

15 Element gruppenanordnung , auszuwahlen, die moglichst alle der 
frei gewordenen oder frei werdenden Elemente abdeckt bzw. 
moglichst wenig Elemente des multidimensionalen Feldes unge- 
nutzt lasst. Wenn lediglich auf die Geometrie Rucksicht 
genommen wird, etwa weil alle Daten handhabenden Elemente des 

20 multidimensionalen Feldes den fur die Hineinkonf iguration er- 
forderlichen Funktionsumf ang besitzen, so kann die Auswahl 
mit per se bekannten Algorithmen wie bei der Schnittmusterop- 
timierung erfolgen. Es kann dabei entweder auf die bereits 
verfugbaren Elemente Bezug genommen werden. oder es kann, ins- 

25 besondere im Hinblick darauf / dass die Umkonf iguration 

oftmals die Obertragung von Konf igurationsdaten zu den Ele- 
• • menten umfasst und eine solche 

Umkonf igurationsdatenubertragung Zeit in Anspruch nimmt, vor- 
gesehen werden, dass auch vermutlich bald verfugbare Elemente 

30 mit bei der Auswahl der jeweils optimalen Geometrie beriick- 

sichtigt werden. Dabei kann ausgenutzt werden, dass es haufig 
moglich ist, vorherzusagen, dass bestimmte Elemente bald fur 
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die Umkonfiguration verfugbar werden, etwa wenn sie Daten far 
die Weiterverarbeitung von Zellen erhalten haben, die bereits 
ihre Umkonf igurierbarkeit angedeutet haben und die Anzahl der 
noch erforderlichen Verarbeitungstakte, der hierzu daten- 
stromabwarts liegenden Zellen endlich und abschatzbar oder 
bekannt ist. Derartige Information ist erf indungsgemafi als 
Umkonf igurierbarkeits-Vorhersage verwaltbar. Dafi zu den ver- 
fugbaren und/oder benotigten Elementen auch Busverbindungen, 
Leitungen etc. zahlen, sei erwahnt. 



• Die Auswahl der optimalen Konf iguration kann dabei in einem 
Praprozessor oder einem Teilbereich des multidimensionalen 
Feldes der rekonf igurierbaren Elemente erfolgen und insbeson- 
dere von einem Datenverarbeitungsprogramm und/oder -mittel 

15 ubernommen werden, das die Durchfuhrung der verschiedenen 

Aufgaben zeitlich koordiniert, Priorisierungen vornimmt usw. 
Es kann sich hierbei insbesondere ura einen Teil eines Be- 
triebs systems handeln, sofern das multdimensionale Feld 
rekonf igurierbarer Elemente als Prozessor oder Koprozessor 

20 ausgefuhrt ist. Die Verwendbarkeit der CT, eines Schedulers 

fur Hyperthreading, Multitasking, Multithreading usw. sei er- 
wahnt. Auf entsprechende weitere Teile der vorliegenden 
Anmeldung sei diesbezuglich verwiesen. Dafi solche Einheiten 
hard- und/oder sof twaremaflig implementierbar sind, sei er- 

25 wahnt. 

Gerade dann, wenn Konf iguratiohsdaten aus einem Speicher ein- 
gelesen werden,- der nicht vernachlassigbare Zugrif f szeiten 
besitzt, bzw. wenn sie, sollte eine Echtzeitbestimmung einer 
30 Konfiguration gewunscht werden, mit nicht vernachlassigbaren 
Generierungszeiten generiert werden, ist es wunschenswert , 
zunachst einen Kenndatensatz vorzusehen, der gegeniiber dem 
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eigentlichen Konf igurationsdatensatz in der Grosse reduziert 
ist und dann eine Auswahl nur auf Grund dieses Kenndatensat- 
zes zu treffen. So karm etwa beim Laden einer neuen 
Konf iguration aus einem langsamen Speicher wie von einer 
5 Festplatte zunachst lediglich ein Kenndatensatz bzw. eine 
Kenndatensatzgruppe 'heruntergeladen werden, der die Umrisse 
der Konf iguration betrifft. Da ein solcher Umriss kenndaten- 
satz in der GroiJe gegeniiber dem vollstandigen 

Konf igurationsdatensatz typisch sehr reduziert sein wird, ist 

10 es auch moglich, eine Vielzahl von Kenndatensat zen fur eine 
Vielzahl unterschiedlicher Konf igurationen. vorab in einen 
Hauptspeicher zu laden, der einen sehr schnellen Zugriff er- 
laiubt, an Hand der unterschiedlichen Konf igurationsdatensatze 
eine schnelle Auswahl zu treffen und dann aus dem langsamen 

15 Speicher die kompletten Konf igurationsdaten zur ausgewahlten 
Konf iguration herunter zu laden. Es sei darauf hingewiesen, 
dass es in solchen Fallen auch moglich ist, einen Teil der 
Konf igurationen vorneweg miteinzulesen, etwa dann, wenn ab- 
sehbar ist, dass bestimmte Konf igurationen typisch bevorzugt 

20 sind, sei es, weil statist ische Auswertungen des typischen 

Datenverarbeitungsbetriebes fur eine Vielzahl von multidimen- 
sionalen Feldern rekonf igurierbarer Elemerite oder fur ein 
einzelnes multidimensionales Feld. dies ergeben haben, etwa 
we.il zu • einer Gruppe von Anwendungen wie im UMTS-Base- 

25 Station-Bereich durch Analyse typischer Aufgaben festgestellt 
wurde, dass bestimmte Umkonf igurationen besonders haufig auf- 
treten, oder weil fttr einen einzelnen Benutzer festgestellt 
wurde, dass immer wieder dieselben Anwendungen parallel in 
bestimmter Weise in das Feld hinein konfiguriert werden miis- 
30 sen.- Das Vorab-Mitladen bestimmter Konf igurationen kann auch 
dann sinnvoll sein, wenn sich diese Konf igurationen durch ei- 
ne besonders einfache Geometrie auszeichnet, etwa weil sehr 
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kleine Volumina des multidimensionalen Feldes rekonf igurier- 
barer Elemente davon iiberdeckt werden (Volumina niitimt hier 
auf das Volumen des multidimensionalen Feldes Bezug, bezeich- 
net also bei zweidimensionalen Felder rekonf igurierbarer 
Elemente die Flache bzw. Flachengeometrie der fur die Umkon- 
figuration verfugbaren rekonf igurierbaren Elemente etc.). 



Es ist auch moglich und insbesondere bei der Abarbeitung kom- 
plexer Auf gabenstellungen, sei es durch die Abarbeitung 

10 besonders rechenintensiver Probleme, sei es im Multitasking, 
Multithreading oder bei anderen Formen der Parallelabarbei- 
tung von Daten, auch bevorzugt, zu iiberpriifen, ob mehrere f 
insbesondere gleich priorisierte Elementgruppenanordnungen 
fur unterschiedliche Aufgaben simultan durch geeignete Aus- 

15 wahl in das Feld hinein konf igurierbar sind. Dabei kann, 

abhangig von der Priorisierung einer bestimmten Aufgabe vor- 
gesehen werden, dass die fur die Abarbeitung einer 
vorgegebenen Aufgabe zur Verfiigung gestellte Flache oder Ab- 
arbeitungszeit gr oiler oder kleiner. ausfallt, etwa indem durch 

20 Aufbau von Sequenzern mit den Daten handhabenden Elementen 

die Grofie einer Konf iguration unter Verlangsamung der Daten- 
abarbeitung verringert wird.. 

Es kann auch erwuhscht sein, dass zunachst eine erste Ele- 
25 mentgruppenanordnung in das Feld hinein konfiguriert wird und 
begonnen wird, mit dieser Element gruppenanordnung die Aufgabe 
abzuarbeiten r bis ein vorgegebenes Ereignis- auftritt und dann 
unter zumindest partieller Rekonf iguration mit der Aufgaben- 
abarbeitung in einer weiteren Elementgruppenanordnung 
30 fortgefahren wird. Hierbei kann etwa vorgesehen werden, dass 
zur Erzielung einer bevorzugten Geometrie von Konf igurationen 
auf dem multidimensionalen Feld, etwa streif enf ormig hinter- 
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einander angeordneten Zellen fur jede Aufgabe, zu festgeleg- 
ten Taktzeiten, etwa alle tausend, zehntausend oder 
hunderttausend Takte, die Abarbeitung aller oder eines Teiles 
aller Konf igurationen unterbrochen wird, die Ergebnisse wie 
5 erforderlich zwischengespeichert werden, auch was nur in ei- 
ner Konf iguration intern erf orderliche Daten wie Schleifen-, 
ZahlerstSnde usw. angeht, und dann eine Neukonf iguration mit 
entsprechenden, bevorzugten Geometrien vorgenommen wird, um 
so ein allmahliches Zerfasern von Konf igurationen zu vermei- 
10 den, was schon aufgrund des erhohten Bedarfs an Busleitungen 
unerwunscht ist. 



Alternativ und/oder zusatzlich ist es auch moglich, selbst- 
faltende Konf igurationen vorzusehen, wobei etwa zunachst mit 

15 der Abarbeitung einer Konf iguration uber das gesamte Array 
begonnen wird, und sich dann, sobald zusatzliche Ressourcen 
durch eine andere Aufgabe angefordert werden, diese erste 
Konf iguration mehr oder minder selbsttatig zusammenzieht , et- 
wa durch Sequenzerbildung mit einem Element, um Elemente fur 

20 die neue Aufgabe freizugeben. Dieses Zusammenziehen kann 
durch Vorgabe neuer, Platz sparenderer Konf igurationen fur 
ein und dieselbe Aufgabe" erreicht werden, insbesondere dann f 
wenn diese Platz sparenderen Konf igurationen in bei den Daten 
handhabenden Elementen vorgesehenen Konf igurationsspeichern 

25 mit abgelegt werden* Auf die Anmeldung zur Wave- 

Rekonf iguration sei dabei nur beispielsweise hingewiesen, Es 
ergibt sich dann eine Situation, bei der Konf igurationen all- 
mahlich enger und enger zusammenrucken.. 

30 Die Auswahl einer vorgegebenen Element gruppenanordnung, die 
in ein Feld hinein zu konf igurieren ist, kann, abgesehen von 
der verfiigbaren Geometrie, auch von anderen Parametern abhan- 
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gig gemacht werden. Hierzu zahlt unter anderem die erzielbare 
Abarbeitungsgeschwindigkeit, die Prioritat einer Aufgabe 
und/oder der Energieverbrauch; der zur Abarbeitung einer vor- 
gegebenen Aufgabe in einer vorgegebenen Zeit erforderlich 
5 ist. Es sei darauf hingewiesen, dass mehrere Parameter 

gleichzeitig betrachtet werden konnen, sei es dadurch, dass 
zunachst anhand eines ersten Parameters wie des benotigten 
Feldvolumens als gleichwertig angesehene Konf igurationen 
durch Betrachten eines zweiten Parameters verworfen werden, 
10 sei es, indem, etwa mit Methoden der unscharfen Logik, mehre- 
" re Parameter gleichzeitig soweit wie moglich optimiert 
werden. 

Die Erfindung wird nun im Folgenden nur beispielsweise anhand 
15 der Figuren erlautert, worin gezeigt ist durch 

Fig, Dl ein multidimensionales Feld Daten handhabender 
Elemente in teilweise zu rekonf igurierendem Zu- 
stand; 

20 Fig- D2 Beispiele fur unterschiedliche Konf igurationsgeo- 

metrien; 

Fig. D3 ein teilweise zur Laufzeit umkonf igurierter Pro- 
zessor. 

25 Nach Fig. 1 umfasst eine allgemein mit 1 bezeichnete Daten- 
verarbeitungsvorrichtung 1 ein multidimensionales Feld 
rekonf igurierbarer Elemente 2 sowie einen Praprozessor 3, der 
Konf igurationen in das multidimensionale Feld 1 uber geeigne- 
te Datenbusse 4 einspeist und Inf ormationen uber 

30 rekonf igurierbare Elemente aus dem multidimensionalen Feld 2 
mehrere Elemente erhalt sowie mit einem Speicher 5 mit lang- 
samem Zugriff verbunden ist, in dem Konf igurationen fiir in 
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dem multidimensionalen Feld 2 abzuarbeitende Aufgaben vorab 
abgelegt sind. 

Der multidimensionale Prozessor 1 ist im vorliegenden Bei- 
5 spiel eine XPU-Architektur, die PAE als konf igurierbare 

Elemente aufweist und nach PACT 02, 04, 08, 10, 13 aufgebaut 
ist. Er erhalt Daten von Eingabe-/Ausgabe-Schnittstellen 6 in 
Echtzeit zur Abarbeitung, wobei nicht vorhersehbar ist, wie 
diese Daten eintreffen und/oder abzuarbeiten sind. Es konnen 
10 hierfur eine Tastatur, Bilder abrufende Kameras, A/D-Wandler 
usw. vorgesehen sein. 

Das multidimensionale Feld 2 besteht, zur Vereinfachung der 
Veranschaulichung, obwohgl technologisch keinesfalls zwin- 

15 gend, vorliegend nur aus einer Reihe ausschliefilich 

identischer datenhandhabender Elemente, zwischen denen geeig- 
nete Vernetzungen uber Busse und dergleichen konf igurierbar 
sind. Aus Grlinden der Anschaulichkeit wird vorliegend von un- 
begrenzten Busressourcen ausgegangen, obgleich rein praktis.ch 

20 die typische Anwendung auch solcher Ressourcen und deren 

Knappheit bei der Vorabbestimmung multipler Konf igurations- 
moglichkeiten berticksichtigt wird. Die datenhandhabenden 
Elemente sind im vorliegenden Fall geeignet, sequenzartig die 
Befehle abzuarbeiten, wie dies per se bekannt ist, das heifit, 

25 es ist moglich, Sequenzer uber einzelne Zellen oder Gruppen 
derer aufzubauen. Dafi hierbei ein Zeitteilungsmultiplexing 
moglich ist, sei erwahnt. Dies erlaubt eine entsprechende 
Faltung mehrerer Operationen, dann dann bei grolien Arrays 
bzw. mehr Platz auch ausgefaltet werden konnen. 



30 



Das multidimensionale Feld 2 ist lauf zeitrekonf igurierbar , 
das heifit es ist moglich, einzelnen der datenhandhabenden 
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Elemente Oder Gruppen derer neue Aufgaben wahrend der Lauf- 
zeit zuzuordnen, ohne den Betrieb der Gesamt-Anordnung oder 
anderer Elemente bzw. Gruppen ' derer insgesamt zu unterbre- 
chen. Wie bevorzugt und per se bekannt sind den 
5 datenhandhabenden Elementen Konf igurationsspeicher lokal zu- 
geordnet, genau so Wie Register, namlich Forward- und 
Backward-Register, Busleitungen, f eingranulare Zustandsma- 
schinen zum Austausch von Triggersignalen untereinander und 
mit der Praprozessoreinheit 3 usw. Auf die Moglichkeit der 

10 Ausgestaltung der rekonf igurierbaren Elemente nach PCT-DE 

97/02949, PCT-DE 97/02998, PCT-DE 98/00334, .PCT/DE 99/00504, 
PCT/DE 99/00505, PCT/DE 00/01869 usw. sei hingewiesen. Die 
vorgenannten Schutzrechte und die weiteren Schutzrechte des 
Anmelders zu rekonf igurierbaren Prozessoren, deren Teilen und 

15 Verfahren zu deren Betrieb sind zu Of f enbarungszwecken voll- 
umfanglich integriert. 

Der Praprozessor 3 ist dazu ausgebildet, Konf igurationen in 
das multidimensionale Feld hinein zu laden und zwar iiber Lei- 

20 tungen 4, wenn er aus dem multidimensionalen Feld die Meldung 
erhalt, dass einzelne Elemente oder Gruppen derer rekonf igu- 
rierbar sind. Der Praprozessor 3 enthalt einen lokalen 
Speicher (Cache) und ist mit einem weiteren Speicher 5 (Hard- 
disk, RAM) verbunden, auf den langsamer zugegriffen werden 

25 kann und auf dem Konf igurationsdaten abgelegt sind. Geeignet 
ist etwa eine CT. 

Es sei darauf hingewiesen, dass es nicht erforderlich ist, 
den Praprozessor 3 als externes Bauteil vorzusehen. Die ge- 
30 zeigte Darstellung wurde ausschliefilich aus didaktischen 

Grunden gewahlt. Er kann integriert sein mit dem multidimen- 
sionalen Feld 2 auf einem einzelnen Chip und/bder seine 
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Funktion kann durch einzelne Daten handhabende Elemente 2 des 
Prozessorf eldes ausgefuhrt werden. 

Uber die Leitungen 4 werden Konf igurationsdaten und Konfigu- 
5 rationsanforderungen ubertragen. Auf die Implementierung von 
Rdy/Ack-Protokollen/ Vorab-Konf iguration von Elementen in 
elementennahen Speichern etc., die moglich, aber nicht zwin- 
gend ist, wird hingewiesen. 

10 Im Speicher 5 sind nun eine Vielzahl von Konf igurationen fur 
unterschiedliche Aufgaben und Kenndaten hierzu abgelegt. Dies 
wird fur ein einf aches Beispiel mit Bezug auf Fig. 2 erlau- 
tert . 



15 Nach Fig. 2 sind etliche Konf igurationen far zwei Aufgaben a) 
und b) abgelegt. Wie ersichtlich, sind fur die Aufgabe a) 
insgesamt vier Konf igurationen abgelegt , die alle dieselbe 
Funktion ausfiihren, aber unterschiedliche Verbindungen der 
Zellen untereinander haben und sich insbesondere hinsichtlich 

20 ihrer aufieren geometrischen Gestalt unterscheiden, in der die 
Zellen angeordnet sind. 

Wie ersichtlich, sind beispielsweise drei Konf igurationen 
vorabgelegt, in denen sieben datenhandhabende Elemente wie 

25 PAEs benotigt werden und eine Konf iguration , in der unter' 
Ausnutzung der Sequenzereigenschaf t der datenhandhabenden 
Elemente nur vier Elemente benotigt werden. Die geometrische 
Form der jeweiligen Konf iguration ist dabei wie durch die 
Zahlen in Klammern angedeutet, gleichfalls mitabgelegt. Die- 

30' ser Kenndatensatz umfasst eine erste Ziffer, die angibt f 
wieviele Spalten Abstand die auliersten Zellen links und 
rechts voneinander haben; es folgen dann nach einem Komma die 
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Anzahl der Elemente in einer Spalte, die benotigt werden. 
Sind in einer Spalte Reihen frei, d. h. nicht belegt, steht 
gleichfalls ein b in der Kennung. 1st dabei eine Spalte frei- 
gelassen, das heilit von der jeweiligen Konf iguration bis auf 
5 Busse nicht belegt, so steht hierfur ein b.in der Konf igura- 
tion. Dies ist ersichtlich an den Konf igurationen I und II. 
Die Daten zu einer Spalte sind von jenen der nachsten Spalte 
durch Koirana getrennt. Ahnliche Konf igurationsdaten sind auch 
fur eine zweite Konf iguration abgelegt b) . 

10 

Die Anordnung wird verwendet wie folgt: 

Wenn im multidimensionalen Feld rekonf igurierbarer Elemente 
Ressourcen fur die Rekonf iguration freigegeben sind, wie dies 

15 .durch die M 0" in Fig. 2 dargestellt ist, so ladt der Prapro- 
zessor 3 aus dem Speicher 5 zunachst .die wenig umf angreichen 
und damit schnell zu ladenden Kennsatze zu -den Konf iguratio- 
nen. Er bestimmt dann, welche Aufgabe schnell abzuarbeiten 
ist und welche Konf igurationen gemeinsam besonders gut in das 

20 Feld eingeladen werden konnen.. Dies geschieht durch Vergleich 
der maximalen Spaltenbreite einer moglichen Konf iguration mit 
der tatsachlich verfugbaren Spaltenbreite. Zur Aufgabe a) 
konnen so Konf iguration III und IV verworfen werden, die zu- 
viel Spalten benotigen. Aus den verbleibenden sind aufgrund 

25 der geometrischen Form die Konf igurationen I und II gleich- 
falls zu verweirfen. Es wird dann untersucht, welche 
Konf iguration von b) zu laden ware. Hier sind per se alle 
drei Konf igurationen ladbar. 

-r 

30 Nun wird untersucht, ob es eine Moglichkeit gibt, von den 
verbleibenden Konf igurationen zu den Aufgaben gleichzeitig 
zwei Konf igurationen in das Feld zu laden. Dazu werden die 
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und es wird die benotigte maximale Spalten- und Reihenzahl 
mit der verfugbaren Maximalzahl verglichen. Es wird so fest- 
gestellt, dafi sich eine optimale Ausnutzung der 
5 f reigewordenen Element e ergibt, wenn die Konf igurat ion lb und 
die Konf iguration la' unmittelbar ubereinander angeordnet war- 
den. Diese Konf igurationen werden dann in das Prozessorf eld 
geladen. 

10 Daraufhin kann die Datenverarbeitung mit einer Konfigurati- 
onsanordnung wie in Fig. 3 gezeigt fortgesetzt werden. 
Es sei erwahnt, dass in Fallen, in denen unterschiedliche Da- 
ten handhabende Elemente vorgesehen werden, die entsprechende 
Information gleichfalls im Kenndatensatz abgelegt werden 

15 kann. 

Wie vorstehend ersichtlich, ist die Art und Weise, wie ein 
gegebenes Prozessorf eld fur eine vorgegebene Weise konfigu- 
riert werden mufl, nicht eindeutig.' Dies gilt insbesondere 

20 dann, wenn es sich urn komplexe Felder handelt, bei denen etwa 
zumindest zum Teil in den Leitungen Register vorgesehen sind 
und weiter mit diesen insbesondere auch Additionen und/oder 
Vergleiche von Daten durchzuf uhren sind, wie dies auch in 
arithmetische Logikeinheiten (ALUs) aufweisenden Logikzellen 

25 des Feldes" der Fall sein kann. Oft ist es auch moglich 

und/oder notig f etwa bei Inbetriebnahme, aus vielen Konf igu- 
rationen mehrere mogliche zu wahlen. 



Es ist bereits vorgeschlagen worden, eine Konf iguration aus 
30 mehreren per se verwendbaren auszuwahlen anhand der momenta- 
nen Konf igurierbarkeit unter geometrischen Aspekten, der 
Ressourcenverfugbarkeit und/oder auszuwahlen aufgrund von Ge- 
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schwindigkeitsaspekten. Dies kann die Auswahl erleichtern, 
stellt aber oftmals nur unzureichende Kriterien dar. Es ist 
wtinschenswert, die Konf igurationsauswahl weiter verbessern zu 
konnen. Es ist weiter oftmals moglich, eine bestimmte Daten- 
5 verarbeitungsaufgabe selbst auf unterschiedliche Weise 

durchzufuhren. So ist etwa eine Reihe von Algorithmen be- 
kannt, die es erlauben, einen Satz Daten auf unterschiedliche 
Weise zu sortieren, Auch hier ist es erf orderlich, zwischen 
unterschiedlichen Algorithmen , die prinzipiell geeignet sind, 

10 eine bestimmte Datenverarbeitungsauf gabe zu bewaltigen, auf- 
grund von objektivierbaren Kriterien zu wahlen. DafJ diese 
Wahl zur Laufzeit und/oder davor erfqlgen kann, sei erw&hnt. 
Insgesamt ist es somit wtinschenswert, Auswahlmoglichkeiten 
bei der Datenverarbeitung mit konf igurierbaren multidimensio- 

15 nalen Prozessorf eldern zu verbessern, etwa urn bei 

festgespeicherten Konf igurationen sicherzustellen, dafi eine 
bereits anwendungszweckoptimierte Auswahl getroffen wurde. 

Die vorliegende Erfindung schlagt somit in einem ersten 
Grundgedanken ein Verfahren zur Auswahl eines aus einer Viel- 
zahl von Wegen zur Erzielung eines 

Datenverarbeitungsergebnisses bei der Datenverarbeitung unter 
zumindest moglicher Verwendung multidimensionaler Felder kon- 
figurierbarer Datenhandhabungselemente vor, bei welchem 
vorgesehen ist, daB den Datenhandhabungs element en konfigura- 
tionsabhangig verbraiichsbezogene kennzeichnende Grofien 
zugeordnet werden und eine Wegauswahl anhand der Zuordnung 
erf olgt . 

30 Ein weiterer Grundgedanke kann somit in der Erkenntnis gese- 
hen werden, daB bestimmten Datenverarbeitungswegen typische- 
Leistungs- bzw. Energieaufnahmewerte zugeordnet werden kon- 
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nen, urn dann eine Wegauswahl unter Berucksichtigung derselben 
vorzunehmen. Als Erzielung eines Datenverarbeitungsergebnis- 
ses wird auch eine bestimmte Art und Weise einer 
Zwischenergebnisberechnung und/oder einer Datenhandhabung 
5 etc. betrachtet. Durch die Zuordnung verbrauchskennzeichnen- 
der Grofien wird also* eine wesentliche Ojektivierung der 
Wegauswahl moglich. 

Die Auswahl eines Weges kann beispielsweise die Wahl eines 
10 gegebenen Algorithmus aus einer Vielzahl unterschiedlicher 
. Algorithmen umfassen, sei es ftir - Aufgaben wie das Sortieren 
von Daten, bestimmte mathematische Transf ormationen oder der- 
gleichen. Liegen in einer Programmmodul-Bibliothek etwa 
mehrere Sortieralgorithmen, Algorithmen zur Bestimmung einer 
15 Fourier-Transformierten oder dergleichen vor, so kann z. B. 

zu jeder eine verbrauchskennzeichnende Grofie ermittelt werden 
und es wird dann unter Berucksichtigung derselben eine Aus- 
wahl vorgenommen. So wird es moglich, Algorithmen zu wahlen, 
die beispielsweise einen besonders niedrigen Energieverbrauch 
20 besitzen. Dies kann fur mobile Anwendungen wie bei Laptops, 

Funktelef onen und dergleichen sinnvoll sein, : bietet aber auch 

in Bereichen Vorteile, bei' denen seh'r rechenintensive Aufga- 

■ i 
ben zu bewaltigen sind, etwa in Servern, Basestations usw. , 

wo die in einer Verarbeitungseinheit erzeugte Leistung wegge- 
25 ktihlt und/oder abgefuhrt werden muli. Durch die Erfindung 

konnen so Systemgesamtkosten minimiert werden. Auch kann etwa 
ein Place&Route-Algorithmus die Optimierung ausnutzen, etwa 
zur Erzielung niederenergetischer Anordnungen. Dies ist be- 
sonders bevorzugt und wird als ftir sich erf inderisch 
30 angesehen. 
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Es ist weiter moglich, fur ein und denselben Algorithmus eine 
Vielzahl unterschiedlicher Konf igurationen vorzusehen, etwa 
unter Berucksichtigung verschiedener, simultan und/oder se- 
quenziell auf das multidimensional Feld zu konf igurierender 
5 Teilauf gaben, und dann eine Auswahl aus diesen unter Auswer- 
tung der jeweils zucfeordneten Groiie vorzunehmen. 

Weiter ist es moglich, unter Anwendung des erf indungsgemafien 
Verfahrens daruber zu befinden, ob eine gegebene Aufgabe der 

10 Datenverarbeitung, bzw. eine Teilauf gabe, dem betrachteten 

multidimensionalen .Feld konf igurierbarer Datenhandhabungsele- 
mente und/oder einem anderen Element zur Datenverarbeitung 
aufierhalb des multidimensionalen Feldes zugeordnet werden 
soil; so kann etwa- daruber entschieden werden, ob dann, wenn 

15 das rnultidimensionale Feld als Koprozessor dient, eine be- 
stimmte Teilaufgabe besser auf einer rein sequenziell 
arbeitenden CPU oder dem rekonf igurierbaren, typisch als Da- 
tenfluJiprozessor oder dergleichen arbeitenden 

multidimensionalen Feld abgearbeitet werden soil. Es ist auch 
20 moglich, uber das Erfordernis oder die Sinnhaf tigkeit dedi- 
zierter Schaltkreise wie ASICs fur bestimmte . Auf gaben zu 
befinden. 

Typisch wird es sich bei dem Feld konf igurierbarer Datenhand- 
25 habungselemente urn ein zweidimensionales Feld handeln. Es sei 
erwahnt, dali die Erfindung ftir Felder wie FPGAs, XPP-Prozes- 
soren usw. anwendbar ist. Es ist besonders bevorzugt fur zur 
Lauf zeit konf igurierbare, insbesondere partiell zur Lauf zeit 
ohne Storung nicht iimzukonf igurierende Elemente teil-rekon- 
30 f igurierbarer Prozessorf elder . 
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In typischen Anwendungen wie bei XPP-Feldern werden als zu 
beriicksichtigende Datenhandhabungselemente insbesondere zu- 
mindest einige, bevorzugt alle der Elemente Busse, Register, 
ALUs, RAMs, I/O-Ports sowie konf igurierende Einheiten (CT's) 
5 erfafit. Es sei darauf hingewiesen, dafi von bestimmten dieser 
Telle nur eine abgeschatzte oder partielle Verbrauchsberiick- 
sichtigung erforderlich ist; so brauchen etwa bei Bussen 
lediglich bestimmte Treiberstuf en und dergleichen berucksich- 
tigt werden, Weiter kann es erforderlich sein, auch 
10 Taktbeschaltungen mit zu erfassen, sei es, well in bestimmten 
Datenverarbeitungswegen eine Voll- oder Teilabschaltung eines 
Taktzweiges moglich ist, sei es, well bestimmte Schaltungsbe- 
reiche mit einem unterschiedlichen Takt versorgt werden 
konnen oder miissen. 

Es ist bevorzugt, wenn der kennzeichnende Wert nur grob abge- 
schatzt wird, etwa dahingehend, daii festgestellt wird, ob ein 
bestimmtes Element momentan verwendet wird und/oder konfigu- 
riert ist, oder ob es stattdessen nicht verwendet wird und 

20 gegebenenf alls sogar von einer Spannungsversorgung bis auf 
einen Wake-up-Schaltkreis und/oder von einer Taktversorgung 
zumindest weitgehend abgeklemmt ist. Es ist also nicht erfor- 
derlich, eine absolut exakte Verbrauchskennzeichnung . 
vorzunehmen, etwa unter. Festlegurig des Verbrauchs der spezi- 

25 fischen algebraischen Operation, die einer jeweiligen 

arithmetisch-logischen E.inheit aktuell und/oder dauerhaft zu- 
geordnet wird. Vielmehr kann es ausreichend sein, die 
verbrauchs kennzeichnende Grofie nur dahingehend zu bes.timmen, 
ob und wie weit tatsachlich das jeweilige Element im Augen- 

30 blick verwendet wird. Ausnahmen hiervpn sind moglich. Eine 

Ausnahme kann insbesondere gemacht werden ftir Operationen wie 
Multiplikationen, bei denen sehr grolie Schaltkreisf lachen mit 
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Leistung versorgt werden mtissen. In einem solchen Fall kann 
eine weitere Detaillierung vorgesehen werden. 

Es ist moglich und bevorzugt, jedem unterschiedlichen Daten- 
5 handhabungselement unterschiedliche Kennzahlen, wie strom- 
und/oder leistungsaufnahmebezogener Grofien als verbrauchs- 
kennzeichnende Grofien zuzuordnen. Dieses kann gegebenenf alls 
in taktabhangiger Weise (Leistungsauf nahme pro Taktf requenz) 
geschehen. Weiter ist es moglich, eine Auswahl unter Beruck- 
10 sichtigung eines Summenwertes vorzunehmen, also uber die 

Betrachtung des Gesamtverbrauchs oder abgeschatzten Gesamt- 
verbrauchs eines betrachteten Weges zu entscheiden. 

Die Auswahl wird typisch nicht alleine unter Berucksichtigung 
15 der verbrauchskennzeichnenden Grofien erfolgen, sondern kann 
andere Parameter miterfassen, etwa eine erf orderliche Ausfuh- 
rungszeit, erf orderliche Ressourcen auf einem 

multidimensionalen Feld, eine aktuelle oder erwartete Prozes- 
sorauslastung durch andere Aufgaben und/oder eine aktuell 
20 gewunschte beziehungsweise erwartete oder zulassige Lei- 
stungsauf nahme. Die Kennzahlen sind durch MeBwerte. und/oder 
Hardware- bzw. Syntheseanalysen .erhaltlieh und insbesondere 
in Look-Up-Tabeilen hinterlegbar . 

25 Die Auswahl des jeweiligen Weges kann vor der eigent lichen 

Datenverarbeitung erfolgen, etwa bei der Festlegung von spa- 
ter zu ladenden Konf igurationen unter mehreren, theoretisch 
implement ierbaren Konf igurationen. In einem solchen Fall ist 
es besonders 1st bevorzugt , wenn die kennzeichnende Grolie 

30 wahrend der Simulation der Datenverarbeitungsfunktionen mit 
ermittelt wird. Alternativ kann vorgesehen werden, dafi die 
Auswahl unter verschiedenen moglichen Wegen wahrend der Lauf- 
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zeit erfolgt. In einem solchen Fall werden etwa mehrere mog- 
liche Algorithraen, z. B. um Daten zu sortieren, 
bereitgestellt, es wird dann abgefragt, wie viele einzelne 
Daten zu sortieren sind und wie gegebenenf alls der Ordnungs- 
5 grad dieser Daten ist und es wird erst danach eine Auswahl 

unter verschiedenen,' vorher bestimmten Algorithmen anhand der 
ihnen zugeordneten parametrierten Verbrauchskennzeichnungs- 
grofien wie der Gesamtleistungsaufnahme usw. vorgenommen. 
Analog kann auch eine Konf iguration zur Lauf zeit abhangig von 
10 z . B . einer momentan moglichen oder gewunschten Stromauf nahme 
erfolgen. 

Dieser Aspekt der Erfindung wird im folgenden nur beispiels- 
weise beschrieben, ohne dafi Bezug genommen wird auf eine 

15 

Figur . 

Es wird zunachst eirie gewunschte Art der Daten-Bearbeitung 
festgelegt, die auf dem Prozessorf eld durchgefuhrt werden 

20 soil. Beispielsweise wird ein Viterbi-Algorithmus program- 
miert und eine fur das betrachtete Prozessorf eld geeignete 
Konf iguration bestimmt. Es wird dann ermittelt, welclje Ein- 
heiten auf dem Prozessorf £ld verwendet werden und uber wie 
viele Takte dies geschieht. Bei der Betrachtung der verwende- 

25 ten Elemente werden in einem Beispiel berucksichtigt ALUs, 

Vorwarts- und Riickwarts-Register (FREG und BREG) sowie Schal- 
ter in Bussen (LSW und RSW.) . Es wird dann der gesamte 
Energieverbrauch je Element art bestimmt und anschliefiend der 
gesamte Energieverbrauch aller unterschiedlichen Einheiten. 

30 Die Energieverbrauchswerte fur ein einzelnes Element je Takt 
sind ihrerseits abgeschatzt aus Simulationen der Hardware- 
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schaltungen bei der betrachteten Architektur und sind fur das 
Verfahren der Erfindung tabellarisch hinterlegt. 

In dem betrachteten praktischen Beispiel sind fur die Imple- 
5 mentierung eines gegebenen Viterbi-Algorithmus 10 ALUs, 17 
Vorwartsregister, 23 Ruckwartsregister sowie 30 Busschalter 
(LSW) in einer und 35 Schalter in der entgegengesetzten Rich- 
tung (RSW) erf orderlich. Bei einem Energieverbrauch von 4,85 
pW/Hz je ALU, 7,01 pW/Hz pro FRE.G, 7,02 pW/Hz je BREG sowie 
10 2,03 pW/Hz je Busschalter ergibt sich folgende Tabelle: 

Number of cycles: 1582 

Energy consumption 

15 

Einzelkennzahl Gesamtkennzahl 



ALU: 


10,00 


X 


4,85 




48,50 


FREG: 


17,00. 


X 


7,01 




119,17 


BREG : 


23,00 


X 


7,02 




161,46 


LSW: 


30,00 


I 

X 

1 


2,03 




60,90 


RSW: 


35,00 


X 


2,03 




71,05 



Total: 461,08 pW/Hz 

25 

Es kann nun der Implementierung der Viterbi-Tran'sformation 
ein Gesamtleistungsverbrauch von 461,08 pW/Hz zugeordnet wer- 
den und dieser so erhaltene Wert verglichen werden mit 
Werten, die bei anderen Algorithmen und/oder Konf igurationen 
30 erhalten werden und/oder durch dedizierte Schaltkreise wie 
ASICs zu erhalten sind. 
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Es sei nun erwahnt, dafi die Auswahl einer aus einer Vielzahl 
von Konfigurationen, auch dann sinnvoll sein kann, wenn das 
Datenverarbeitungslogikzellen- und/oder, hier gleichbedeu- 
tend, Mischfeld aus analogen und/oder digi'talen Zellen (wie 
5 beschrieben) an eine insbesondere sequentielle CPU angekop- 
pelt ist. 

Ein Problem bei herkornmlichen Ansatzen zu rekonf igurierbaren 
Technologien besteht dann aber oft, wenn die Datenverarbei- 
10 tung primar auf einer sequenziellen CPU unter Hinzuziehung 
eines konf igurierbaren Datenverarbeituncjslogikzellenf eldes 
oder dergleichen erfolgen soil und/oder eine Datenverarbei- 
tung gewiinscht ist, in der viele und/oder umf angreiche 
sequenziell auszuf uhrende Verarbeitungsschritte vorliegen. 

15 

Es sind Ansatze bekann-t, die sich damit befassen, wie eine 
Datenverarbeitung sowohl auf einem konf igurierbaren Datenver 
arbeitungslogikzellenfeld als auch auf einer CPU erfolgen 
kann. 

20 

So ist aus der WO 00/49496 ein Verfahren zum Ausftihren .eines 
Computerprogrammes mi't einem Prozess'or bekannt, der eine kon 
figurierbare funktionelle Einheit umfass.t, die in der Lage 
ist, rekonf igurierbare Anweisungen auszufuhren, deren Effekt 

25 zur Laufzeit durch Laden eines Konf igurationsprogrammes rede 
f iniert werden kann, wobe.i das Verfahren die Schritte ' 
umfasst, dali Kombinationen rekonf igurierbarer Anweisungen 
ausgewahlt, ein respektives Konf igurationsprogramm fur jede 
Kombination erzeugt und das Computerprogramm ausgefuhrt wird 

30 Dabei soil jedes Mai, wenn eine Anweisung aus einer der Kom- 
binationen wahrend der Ausfuhrung gebraucht wird und die 
konfigurierbare funktionelle Einheit nicht mit dem Konfigura 
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tionsprogramm fur diese Kombination konfiguriert ist, das 
Konf igurationsprogramm fur alle der Anweisungen der Kombina- 
tion in die konf igurierbare funktionelle Einheit geladen 
werden. Weiter ist aus der WO 02/50665 Al eine Datenverarbei- 
5 tungsvorrichtung mit einer konf igurierbaren funktionellen 

Einheit bekannt, wobei die konf igurierbare funktionelle Ein- 
heit dazu dient, eine Anweisung gemali einer konf igurierbaren 
Funktion auszufiihren. Die konf igurierbare funktionelle Ein- 
heit weist eine Vielzahl von unabhangigen konf igurierbaren 

10 Logikblocken zum Ausfiihren programmierbarer Logikoperationen 
auf, urn die konf igurierbare Funktion zu implement ier en. Kon- 
figurierbare Verbindungsschaltkreise sind zwischen den 
konf igurierbaren Logikblocken und sowohl den Eingangen als 
auch den Ausgangen der konf igurierbaren funktionellen Einheit 

15 vorgesehen. Dies erlaubt eine Optimalisierung der Verteilung 
von Logikfunktionen uber die konf igurierbaren Logikblocke. 

Ein Problem bei herkommlichen Architekturen besteht auch 
dann, wenn eine Ankopplung erfolgen soil und/oder Technologi- 

20 en wie Datastreaming, Hyperthreading, Multithreading und so 

vreiter in sinnvoller und Performance steigernder Weise ausge- 
nutzt werden sollen. Die beispielhaft erwahnte Technologie 
der vorzitierten Nicht-Anmelder-Dokumente zeigt etwa eine An- 
ordnung f bei der zwar Konf igurat'ionen in ein konf igurierbares 

25 Datenverarbeitungslogikzellenf eld geladen werden konnen, bei 
welchen allerdings der Datenaustausch zwischen der ALU der 
CPU und dem konf igurierbaren Datenvera-rbeitungslogikzellen- 
feld, sei es ein FPGA, DSP oder dergleichen, uber die 
Register erfolgt. Mit anderen Worten mussen Daten. aus einem 

30 Datenstrom zunachst sequenziell in Register geschrieben wer- 
den und dann sequenziell wieder in diesen abgelegt werden. 
Auch ist ein Problem dann gegeben, wenn ein Zugrif f auf Daten 
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von extern erfolgen soil, da selbst dann noch Probleme beim 
zeitlichen Ablauf der Datenverarbeitung im Vergleich zur ALU 
und bei der Zuweisung von Konfigurationen und so weiter be- 
stehen. Die herkommlichen Anordnungen, wie sie aus den Nicht - 
5 Anmelder-eigenen Schutzrechten bekannt sind, werden unter an- 
derem dazu verwendet, Funktionen im konf igurierbaren 
Datenverarbeitungslogikzellenfeld, DFP, FPGA oder dergleichen 
abzuarbeiten, die nicht effizient auf der CPU-eigenen ALU ab- 
zuarbeiten sind. Damit wird das konf igurierbare 
10 Datenverarbeitungslogikzellenfeld praktisch verwendet, urn be- 
nutzerdefinierte Opcodes zu ermoglichen, die eine 
effizientere Abarbeitung von Algorithmen ermoglichen, als 
dies auf dem ALU-Rechenwerk der CPU ohne konf igurierbare Da- 
tenverarbeitungslogikzellenfeldunterstutzung moglich ware. 

15 

Im Stand der Technik ist, wie erkannt wurde, die Ankopplung 
demnach im Regelfall wortbasiert, nicht jedoch blockbasiert , 
wie es zur datenstromenden Verarbeitung erforderlich ware. Es 
ist zunachst wiinschenswert r eine effizientere Datenverarbei- 
20 tung zu ermoglichen, als dies mit einer engen Ankopplung uber 
Register der Fall ist. 

Eine weltere Moglichkeit zur Verwendung von Logikzellenf el- 
dern aus grob- und/oder f eirigranular gebauten Logikzellen und 

25 Logikzellenelementen besteht in einer sehr losen Ankopplung 
eines solchen Feldes an eine herkommliche CPU und/oder ein 
CPU-Kern bei eingebetteten Systemen. Hierbei kann ein her- 
kommliche s, sequenzielles Programm auf einer CPU oder 
dergleichen laufen, beispielsweise ein in C, C++ oder der- 

30 gleichen geschriebenes Programm, wobei von diesem Aufrufe 

einer Datenstromverarbeitung auf dem fein- und/oder grobgra- 
nularen Datenverarbeitungslogikzellenf eld instantiiert 
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werden. Problematisch ist dann, dass beim Programmieren fur 
dieses Logikzellenf eld ein nicht in C oder einer anderen se- 
quenziellen Hochsprache geschfiebenes Programm fur die 
Datenstromabarbeitung vorgesehen werden muss. Erwiinscht ware 
5 hier, dass sowohl auf der herkommlichen CPU-Architektur als 
auch auf einem mit diesen gemeinsam betriebenen Datenverar- 
beitungslogikzellenf eld C-Programme oder dergleichen 
abzuarbeiten sind, das heifit, dass insbesondere mit dem Da- 
tenverarbeitungslogikzellenfeld in quasi sequenzieller 
10 Programmabarbeitung dennoch eine Datenstromf ahigkeit erhalten 
bleibt, wahrend simultan auch insbesondere moglich bleibt, 
dass ein CPU-Betrieb in nicht zu loser Ankopplung moglich 
ist. Es ist auch bereits bekannt, innerhalb einer Datenverar- 
beitungslogikzellenf eldanordnung, wie sie insbesondere aus 
15 PACT 02 (DE 196 51 075.9-53, WO 98/26356), PACT 04 (DE 196 54 
846.2-53, WO 98/29952), PACT08, (DE 197 04 728.9, WO 
98/35299) PACT 13 (DE 199 26 538.0, WO 00/77652) PACT 31 (DE 
102 12 621.6-53, PCT/EP 02/10572) bekannt ist, auch eine se- 
quenzielle Datenverarbeituhg innerhalb des 
20 Datenverarbeitungslogikzellenfeldes vorzusehen. Hierbei wird 
dann allerdings innerhalb einer einzelnen Konf iguration, bei- 
spielsweise um Ressourcen zu sparen, eine Zeitoptimierung zu 
erzielen und so weiter, eine partielle Abarbeitung erzielt, 
ohne dass diese belreits dazu fuhrt, dass ein Prograramierer 
25 ein Stuck Hochsprachencode automat isch leicht ohne weiteres 
auf ein Datenverarbeitungslogikzellenf eld umsetzen kann, wie 
dies bei herkommlichen Maschinenmodellen fur sequenzielle 
Prozessoren der Fall ist. Die Umsetzung von Hochsprachencode 
auf Datenverarbeitungslogikzellenfelder nach Prinzipien der 
30 Modelle fur sequenziell arbeitende Maschinen ist weiterhin 
schwierig. 
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Aus dem Stand der Technik ist weiter bekannt, dass mehrere 
Konf igurationen, die eine jeweils unterschiedliche Funktions- 
weise von Arrayteilen bewirkeri, simultan auf dem 
Prozessorfeld (PA) abgearbeitet werden konnen und dass ein 
5 Wechsel von einer oder einigen der Konf iguration (en) ohne 

Storung anderer zur Laufzeit erfolgen kann. Es sind Verfahren 
und in Hardware implementierte Mittel zu deren Umsetzung be- 
kannt, wie sichergestellt werden kann, dass dabei ein 
Abarbeiten von auf das Feld zu ladenden Teilkonf igurationen 
10 ohne Deadlock erfolgen kann. Verwiesen wird hierzu insbeson- 
dere auf die die Filmo-Technik betreffenden Anmel.dun.gen 
PACT 05 (DE 196 54 593.5-53, WO 98/31102) PACT10 (DE 198 07 
872.2, WO 99/44147, WO 99/44120) PACT 13 (DE 199 26 538.0, WO 
00/77652), PACT 17 (DE 100 28 397.7, WO 02/13000). Diese Tech- 
15- nologie ermoglicht in gewisser Weise bereits eine 

Parallelisierung und, bei entsprechender Gestaltung und Zu- 
ordnung der Konf igurationen, auch eine Art - 
Multitasking/Multithreading und zwar dergestalt, dass eine 
Planung, das- heiflt ein Scheduling und/oder eine Zeitnutzungs- 
20 planungssteuerung vorgesehen ist. Es sind also aus dem Stand 
der Technik schon Zeitnutzungsplanungssteuerungsmittel und - 
verfahren per se bekannt , die, zumindest unter entsprechender 
Zuordnung von Konf igurationen zu einzelnen Aufgaben und/oder 
Faden zu Konf igurationen und/oder Konf igurationsf olgen, ein 
25 Multitasking und/oder Multithreading erlauben. Die Verwendung 
solcher Zeitnutzungsplanungssteuermittel, die im Stand der 
Technik: zur Konf igurierung und/oder Konf igurationsverwaltung 
verwendet wurden, zu Zwecken des Scheduling von Tasks., 
Threads, Multi- und Hyperthreads wird per seals erfinderisch 
30 angesehen. 
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Wunschenswert ist auch zumindest gemali einem Teilaspekt in 
bevorzugten Varianten, moderne Technologien der Datenverar- 
beitung und Programmabarbeituhg wie Multitasking, 
Multithreading, Hyperthreading unterstiitzen zu konnen, zumin- 
5 dest in bevorzugten Varianten einer Halbleiterarchitektur . 

Ein weiterer wesentlicher Aspekt der vorliegenden Erfindung 
ist somit darin zu sehen, dass dem Datenverarbeitungslo- 
gikzellenfeld Daten im Ansprechen auf die Ausfuhrung einer 

10 Ladekonfiguration durch das Datenverarbeitungslogikzellenf eld 
zugefuhrt werden und/oder Daten aus diesem Datenverarbei- 
tungslogikzellenf eld weggeschrieben (STORE) werden, indem 
.eine STORE-Konf iguration entsprechend abgearbeitet wird. Die- 
se Lade- und oder Speicherkonf igurationen sind dabei 

15 bevorzugt derart auszugestalten, dass innerhalb des Datenver- 
arbeitungslogikzellenf eldes und/oder einer anderen Einheit 
wie einer RISC-Architektur direkt oder indi'rekt Adressen je- 
ner Speicherstellen generiert werden, auf welche ladend 
und/oder speichernd direkt oder indirekt zugegrif fen werden 

20 soil. Es ist durch diese Einkonf iguration von Adressgenerato- 
ren innerhalb einer Konf iguration moglich, eine Vielzahl von 
Daten in das Datenverarbeitungslogikzellenf eld einzuladen, wo 
sie gegebenenfalls in internen Speichern (iRAM) ablegbar sind 
und/oder wo sie in internen Zellen wie EALUs mit Registern 

25 und/oder dergleichen eigenen Speichermitteln abgelegt werden 
konnen. Die Lade- beziehungsweise Speicherkonf iguration er- 
moglicht somit ein blockweises und nahezu datenstromartiges,. 
insbesondere gegenuber Einzelzugrif f vergleichsweises schnel- 
les Laden von Daten und es kann eine solche Lade-Kohf igura- 

30 tion ausgefuhrt werden vor einer oder mehreren tatsachlich 

Daten auswertend und/oder verandernd abarbeitenden Konfigura- 
tion(en), mit welcher/n die vorab geladenen Daten verarbeitet 
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werden. Das Datenladen kann dabei typisch bei grofien Logik- 
zellenfeldern in kleinen Teilbereichen derselben geschehen, 
wahrend andere Teilbereiche mit anderen Aufgaben befafit sind. 
Bei der in anderen verof fentlichten Dokumenten des Anmelders 
5 beschriebenen Ping-Pong-artigen Datenverarbeitung, bei der 
auf beiden Seiten eines Datenverarbeitungsf eldes Speicherzel- 
len vorgesehen sind, wobei die Daten in einem ersten 
Verarbeitungsschritt von dem Speicher auf der einen Seite 
durch das Datenverarbeitungsf eld zum Speicher auf der anderen 

10 Seite stromen, dort die beim ersten Felddurchstromen erhalte- 
nen Zwischenergebnisse im zweiten Speicher abgelegt werden, 
gegebenenf alls das Feld umkonf iguriert wird, die Zwischener- 
gebnisse dann fur die Weiterverarbeitung zuruckstromen usw., 
kann etwa eine Speicherseite durch eine LOAD-Konf iguration in 

15 einem Array-Teil mit neuen Daten vorgeladen werden, wahrend 
aus der gegentiberliegenden Speicherseite Daten mit einer 
STORE-Konf iguration in einem anderen Array-Teil weggeschrie- 
ben werden. Dieses simultane LOAD/STORE-Vorgehen ist im 
ubrigeh a.uch ohne raumliche Speicherbereichstrennung moglich. 

20 

Das Laden kann insbesondere aus einem Cache und in diesen 
\ hinein erfolgen. Dies hat die Vorteile, dass die externe Kom- 
munikation mit grofieren Speicherbanken uber den 
Cachecontroller gehandhabt wird, ohne dass innerhalb des Da- 

25 tenverarbeitungslogikzellenfeldes separate Schaltanordnungen 
dafur vorgesehen sein mussen, dass der Zugriff in lesender 
oder schreibender Weise bei Cache-Speichermitteln typisch 
sehr schnell und mit allenfalls geringer Latenzzeit erfolgen 
wird und dass auch typisch eine CPU-Einheit, dort typisch 

30 uber eine separate LOAD/STORE-Einheit , an diesen Cache ange- 
bunden ist, sodass ein Zugriff auf Daten und ein Austausch 
derselben zwischen CPU-Kern und Datenverarbeitungslogikzel- 
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lenfeld blockweise schnell und derart erfolgen kann, dass 
nicht fur jedes Ubergeben von Daten ein separater Befehl etwa 
aus dem OpCode-Fetcher der CPU abgeholt und verarbeitet wer- 
den muss, 

5 

Es erweist sich diese Cacheankoppelung auch als wesentlich 
giinstiger als eine Ankopplung eines Datenverarbeitungslo- 
gikzellenfeldes an die ALU uber Register, wenn diese Register 
nur uber eine LOAD/STORE-Einheit mit einem Cache kommunizie- 
10 ren, wie dies aus den Nicht-PACT-eigenen zitierten Schriften 
per se bekannt ist - 

Es kann eine weitere Datenverbindung zu der Lade/Speicher— 
einheit der oder einer dem Datenverarbeitungslogikzellenf eld 
15 zugeordneten Sequenziell-CPU-Einheit vorgesehen sein und/oder 
zu deren Register. 

Es sei erwahnt, dass ein Ansprechen derartiger Einheiten uber 
separate Eingangs-/Ausgangsanschlusse (IO-Ports) der insbe- 
20 sondere als VPU beziehungsweise XPP ausgestaltbaren 

Datenverarbeitungslogikzelle.nanordnung erfolgen kann und/oder 
durch einen oder mehrere einem Einzelport nachgeschaltete 
Multiplexer* 

25 Dass neben dem insbesondere blockweisen und/oder streamenden 
und/oder im Random-Access, insbesondere im RMW-Modus (Read- 
Mddify-Write-Modus) erfolgenden Zugriff auf Cache-Bereiche in 
schreibender und/oder lesender Weise und/oder die LOAD/STORE- 
Einheit und/oder die (per se im Stand der Technik bekannte) 

30 Verbindung mit dem Register der Sequenziell-CPU auch eine 
Verbindung mit einem externen Massenspeicher wie einem RAM, 
einer Festplatte und/oder einem anderen Datenaustauschport 
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wie einer Antenne und so weiter erfolgen kann, sei auch er- 
wahnt. Es kann fur diesen Zugriff auf Cache- und/oder LOAD/ 
STORE-Einheit- und/oder registereinheitverschiedene Speicher- 
mittel ein separater Port vorgesehen sein. Dass hier 
5 geeignete Treiber, Signalaufbereiter fur Pegelanpassung und 
so weiter vorgesehen' sein konnen, sei erwahnt. Im Obrigen sei 
erwahnt, dass insbesondere, jedoch nicht ausschliefilich zur 
Aufbereitung eines in das Datenverarbeitungslogikzellenf eld 
hineinstromenden Oder in diesem stromeriden Datenstrom die Lo- 
10 gikzellen des Feldes ALUs bzw. EALUs umfassen konnen und 

typisch werden, cj^nen eingangs- und/oder ausgangsseitig, ins- 
besondere sowohl eingangs- als auch ausgangsseitig kurze, 
feingranular konf igurierbare, FPGA-artige Schaltkreise vorge- 
setzt sein konnen, urn etwa aus einem kontinuierlichen 
15 Datenstrom Vierbitblocke her aus zus chneiden f wie dies fur die 
MPEG-4-Dekodierung erforderlich ist. Es ist dies zum einen 
vorteilhaft, wenn ein Datenstrom in die ZeXTe hineingelangeri 
soil und dort ohne Blockierung von grofieren PAE-Einheiten ei- 
ner Art Vorverarbeitung zu unterwerfen ist. Dies ist auch 
20 dann von ganz besonderem Vorteil, wenn die ALU als SIMD- 

Rechenwerk ausgestailtet wird, wobei dann ein sehr breites Da- 
t'eneingangswort von zum Beispiel 32 Bit Datenbreite uber die 
vorgeschalteten zB FPGA-artigen Streifen auf gespalten wird in 
mehrere parallele Datenworter von. zum Beispiel 4 Bit Breite, 
25 die dann in den SIMD-Rechenwerken parallel abgearbeitet wer- 
den konnen, was die Gesamtperf ormance des Systems signifikant 
zu erhohen vermag, sofern entsprechende Anwendung benotigt 
werden. Es sei darauf hingewiesen f dass vorstehend von FPGA- 
artigen vor- beziehungsweise nachgeschalteten Stru-kturen die 
30 Rede war. Mit FPGA-artig muss aber, was explizit erwahnt sei, 
nicht zwingend Bezug genommen sein. auf i-B'it-granulare Anord- 
nungen. Es ist insbesondere moglich, statt dieser 
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hyperf eingranularen Strukturen lediglich feiner granulare 
Strukturen von zum Beispiel 4 Bit Breite vorzusehen. Das 
heifit, die FPGA-artigen Eingarigs- und/oder Ausgangsstrukturen 
vor und/oder nach einer insbesondere als SIMD-Rechenwerk aus- 
5 gestalteten ALU-Einheit sind so konf igurierbar, dass immer 4 
Bit breite Datenworter zugefuhrt und/oder verarbeitet werden. 
Es ist moglich, hier eine Kaskadierung vorzusehen, so dass 
zum Beispiel die einkommenden 32 Bit breiten Datenworter in 4 
separierte bzw. separierende 8~Bit-FPGA-artige, nebeneinander 

10 angeordnete. Strukturen stromen, diesen 4 Stuck 8 Bit breiten 
FPGA-artigen Strukturen ein zweiter Streifen mit 8 Stuck 4 
Bit breiten FPGA-artigen Strukturen nachgesetzt ist, und ge- 
gebenenfalls nach einem weiteren derartigen Streifen dann, 
sofern dies fur den jeweiligen Zweck als erforderlich erach- 

15 tet wird, zum Beispiel 16 Stuck parallel nebeneinander 

angeordnete 2 Bit breite FPGA-artige Strukturen vorgesehen 
werden. Wenn dies der Fall ist, kann gegenirber rein hyper- 
feingranular FPGA-artigen Strukturen eine betrachtliche 
Verringerung des Konf igurationsaufwandes erzielt werden. Dass 

20 dies uberdies dazu fuhrt, dass der Konf igurationsspeicher und 
so weiter der FPGA-artigen Struktur wesentlich kleiner aus- 
fallen kann und somit eine Einsparung an Chipflache erzielt 
wird, sei erwahnt. 

25 Prinzipiell sind die vorstehend beschriebenen Kopplungsvor- 
teile bei Datenblpckstromen uber den Cache prinzipiell 
erreichbar; besonders bevorzugt ist es jedoch, wenn der Cache 
streif enweise ( slice-art ig) aufgebaut ist und dann ein Zu- 
griff auf mehrere der Slices simultan erfolgen kann, 

30 insbesondere auf alle Slices gleiehzeitig. Dies ist dann vor- 
teilhaft, wenn, was noch erortert werden wird, auf dem 
Datenverarbeitungslogikzellenfeld (XPP) und/oder der Sequen- 
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ziell-CPU und/oder den Sequenziell-CPUs eine Vielzahl von 
Threads abzuarbeiten sind, sei es im Wege des Hyperthrea- 
dings, des Multitaskings und/oder des Multithreadings. Es 
sind also bevorzugt Cachespeichermittel mit Scheibenzugrif f 
5 bzw. Scheibenzugrif fsermoglichungssteuermitteln vorgesehen. 
Es kann dabei z. B. 'jedem Thread eine eigene Scheibe zugeord- 
net werden. Dies ermoglicht es spater, beim Abarbeiten der 
Threads sicherzustellen, " dass jeweils auf die entsprechenden 
Cachebereiche bei Wiederaufnahme der mit dem Thread abzuar- 
10 beitenden Bef ehlsgruppe zugegriffen wird. 

Es sei noch einmal erwahnt, dass der Cache nicht zwingend in 
Slices unterteilt sein muss, und dass, wenn dies der Fall 
ist, nicht zwingend jeder Slice einem eigenen Thread zugewie- 

15 sen werden muss. Es sei allerdings darauf hingewiesen, dass 
dies die bei weitem bevorzugte Methode ist. Es sei weiter 
darauf hingewiesen, dass es Falle geben kann, in denen nicht 
alle Cache-Bereiche simultan oder zu einer gegebenen Zeit 
temporar benutzt werden. Vielmehrist zu erwarten, dass bei 

20 typischen Datenverarbeitungsanwendungen, wie sie in handge- 

haltenen mobilen Telefonen (Handys) , Laptops, Kamera.s und so 
weiter auftreten werden, haufig Zeiten vorliegen werden, in 
denen nicht der gesamte Cache benotigt wird. Es ist daher be- 
sonders bevorzugt, wenn einzelne Cache-Bereiche von der 

25 Leistungsversorgung derart trennbar sind, dass ihr Energie- 
verbrauch signifikant absinkt, insbesondere auf oder nahe 
null. Dies kann bei sliceweiser Ausgestaltung des Caches 
durch sliceweise Abschaltung derselben uber geeignete Lei- 
stungsabtrennmittel geschehen. Die Abtrennung kann entweder 

30 tiber eine Heruntertaktung-, Takt abtrennung oder- eine Lei- 
stungsabtrennung. erfolgen. Es kann insbesondere einer 
einzelnen Cache-Scheibe oder dergleichen eine Zugrif f serken- 
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nung zugeordnet sein, welche dazu ausgebildet ist, zu erken- 
nen, ob ein jeweiliger Cache-Bereich beziehungsweise eine 
jeweilige Cache-Scheibe momentan einen ihm zugeordneten 
Thread, Hyperthread Oder Task hat, von welchem er bemitzt 
5 wird. Sofern dann vom Zugrif f serkennungsmittel festgestellt 
wird, dass dies nicht der Fall ist, wird typisch eine Abtren- 
nung vom Takt und/oder sogar der Leistung moglich sein. Es 
sei erwahnt, dass bei Wiedereinschalten der Leistung nach ei- 
nem Abtrennen ein sofortiges Wiederansprechen des 
10 Cachebereiches moglich ist, also keine signifikante Verzoge- 
rung durch das An- und Ausschalten der Leistungszuf uhr zu ■ 
erwarten ist, sofern mit gangigen geeigneten Halbleitertech- 
nologien eine Implementierung in Hardware erfolgt. 

15 Ein weiterer besonderer Vorteil, der sich bei der vorliegen- 
den Erfindung ergibt, besteht darin, dass zwar eine besonders 
effiziente Kopplung beziiglich des Ubertrags' von Daten bezie- 
hungsweise Operanden in insbesondere blockweiser Form gegeben 
ist, dass aber dennoch ein Balancing nicht in der Weise er- 

20 forderlich ist, dass die exakt gleiche Verarbeitungszeit in 

Sequenziell-CPU und XPP beziehungsweise' Datenverarbeitungslo- 
gikzellenfeld erforderlich ist. Vielmehr erfolgt die ' ■ 
Verarbeitung in einer praktisch oftmals unabhangigen Weise, 
insbesondere derart, dass. die Sequenziell-CPU und die Daten- 

25 verarbeitungslogikzellenf eldanordnung fur einen Scheduler 
oder dergleichen als. separate Ressourcen betrachtbar sind. 
Dies erlaubt eine sofortige Umsetzung bekannter Datenverar- 
beitungsprogrammauf spaltungstechnologien wie Multitasking, 
Multithreading und Hyperthreading. Der. sich ergebende Vor- 

30 teil f dass ein Pf adbalancing nicht erforderlich ist, fuhrt 
dazu f dass beispielsweise in der Sequenziell-CPO beliebige 
Anzahlen von Pipelinestuf en durchlaufen werden konnen, Tak- 
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tungen in unterschiedlicher Weise mogliche sind und so wei- 
ter. Ein weiterer Vorteil der vorliegenden Erfindung besteht 
darin, dass durch das Hineinkonf igurieren einer Ladekonf igu- 
ration beziehungsweise einer Storekonf iguration in das XPP 
5 oder andere Datenverarbeitungslogikzellenf elder die Daten in 
das Feld mit einer Geschwindigkeit hineingeladen werden oder 
aus diesem herausgeschrieben werden konnen, die nicht mehr 
bestimmt ist durch die Taktgeschwindigkeit der CPU, die Ge- 
schwindigkeit, mit welcher der OpCode-Fetcher arbeitet, oder 
10 dergleichen. Mit anderen Worten ist die Ablauf steuerung der 
Sequenziell-CPU nicht mehr f laschenhalsartig begrenzend fur 
den Datendurchsatz des Datenzellenlogikf eldes, ohne dass eine 
nur noch lose Ankopplung besteht. 

15 Wahrend es in einer besonders bevorzugten Variante der Erfin- 
dung moglich ist, die fur eine XPP-Einheit bekannte CT (bzw. 
CM; Konfigurationsmanager bzw. Konf iguratianstabelle) zu ver- 
wenden, urn sowohl das Konf igurieren eines oder mehrerer, auch 
hierarchisch mit mehreren CTs angeordneter XPP-Felder und 
20 gleichzeitig eines oder mehrerer Sequenziell-CPUs, dort quasi 
. als Hyperthreading-Hardwareverwaltung /Scheduler zu verwen- 
den f was den inharenten Vorteil hat, dafi bekannte. 
Technologien wie FILMO usw. fur die hardwareunterstiitzte Ver- 
waltung beim Hyperthreading einsetzbar werden,- ist es 
25 alternativ und/oder, insbesondere in hierarchischer Anord- 
nung, zusatzlich moglich, dass ein 
. Datenverarbeitungslogikzellenfeld wie eine XPP Konf iguratio- 
nen vom OpCode-Fetcher einer Sequenziell-CPU uber das 
Koprozessor-Interface erhalt. Dies fuhrt dazu, daft von- der 
30- Sequenziell-CPU und/oder einer anderen XPP ein Aufruf instan- 
tiiert werden kann, der zu einer Datenabarbeitung auf der XPP 
fuhrt. Die XPP ward dabei dann z. B.' ttber die beschriebene 
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Cache-Ankopplung und/oder mittels LOAD- und/oder STORE - 
Konfigurationen, die Adressgeneratoren fur Laden und/oder 
Wegschreiben von Daten im XPP- bzw. Datenverarbeitungslo- 
gikzellenfeld vorsehen, im Datenaustausch gehalten. Mit 
5 anderen Worten wird eine Koprozessor-artige Ankopplung eines 
Datenverarbeitungslogikzellenf eldes moglich, wahrend gleich- 
zeitig ein datenstromartiges Datenladen durch Cache- und/oder 
I/O-Port-Kopplung erfolgt. 



Es sei erwahnt, dafi die Koprozessor-Ankopplung, d. h. die An- 
kopplung des Datenverarbeitungslogikzellenf eldes typisch dazu 
fiihren wird, dafi das Scheduling auch fur dieses Logikzellen- 
feld auf der Sequenziell-CPU oder einer dieser ubergeordneten 
Schedulereinheit bzw. einem entsprechenden Schedulermittel 
erfolgen wird. In einem solchen Fall findet praktisch die 
Threading-Kontrolle und -verwaltung auf dem Scheduler bzw. 
der Sequenziell-CPU statt. Obwohl dies per ~se moglich ist, 
wird dies, zumindest bei einfachster Implement ierung der Er- 
findung, nicht zwingend der Fall sein. Vielmehr kann eine 
Verwendung des Datenverarbeitungslogikzellenf eldes durch Auf- 
ruf in herkommlicher Weise wie bei einem Standard-Koprozessor 
etwa bei 8086/8087-Kombinationen erfolgen. 

Weiter sei erwahnt, da& es in einer besonders bevorzugten Va- 
25 riante, unabhangig von der Art der Konf iguration, sei es uber 
das Koprozessor-Interf ace, den als Scheduler mitdienenden 
Konf igurationsmanager (CT) der XPP bzw. des Datenverarbei- 
tungslogikzellenf eldes oder dergleichen oder auf andere 
Weise, moglich ist, im bzw. unmittelbar am Datenverarbei- 
30 tungslogikzellenf eld bzw. unter Verwaltung des 

Datenverarbeitungslogikzellenf eldes Speicher, insbesondere 
interne Speicher, insbesondere bei der XPP-Architektur, wie 
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sie aus den diversen Voranmeldungen und den Verof f entlichun- 
gen des Amtielders bekannt ist, RAM-PAEs, Oder andere 
entsprechend verwaltete oder interne Speicher wie ein Vektor- 
register anzusprechen, d- h. die iiber die LOAD-Konf iguration 
5 eingeladenen Datenmengen vektorartig wie in Vektorregistern 
in die internen Speicher abzulegen, dann, nach Umkonf igurie- 
ren der XPP bzw. des Datenverarbeitungslogikzellenf eldes, 
also Uberschreiben bzw. Nachladen und/oder Aktivieren einer 
neuen Konf iguration, die die eigentliche Verarbeitung der Da- 

10 ten durchfuhrt (in diesem Zusairanenhang sei darauf 

hingewiesen, dafi fur eine- solche Verarbeitungs konf iguration 
auch Bezug genommen werden kann auf eine Mehrzahl von Konfi- 
gurationen, die z. B. im Wave-Modus und/oder sequenziell 
riacheinander abzuarbeiten sind) zuzugreifen wie bei einem 

15 Vektorregister und dann die dabei erhaltenen Ergebnisse 

und/oder Zwischenergebnisse wiederum in die internen oder 
uber die XPP wie interne Speicher verwaltetren externen Spei- 
cher, urn dort diese Ergebnisse abzulegen. Die so 
vektorregisterartig mit Verarbeitungsergebnissen beschriebe- 

20 nen Speichermittel unter XPP-Zugriff sind dann, nach 

Rekonf igurieren der Verarbeitungskonf iguration durch Laden 
der STORE-Konf iguration in geeigneter Weise weggeschrieben, 
was wiederum datenstromartig geschieht, sei es iiber den I/O- 
Port direkt in externe Speicherbereiche und/oder, wie beson- 

25 ders bevorzugt, in Cache-Speicherbereiche, auf welche dann zu 
einem spateren Zeitpunkt die. Sequenziell-CPU und/oder andere 
Konfigurationen auf der zuvor die Daten erzeugt habenden XPP 
oder einer anderen entsprechenden Datenverarbeitungseinheit 
zugreifen konnen. 

30 

Eine besonders bevorzugte Variante besteht darin, zumindest 
fur bestimmte Datenverarbeitungsergebnisse. und/oder Zwischen- 
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ergebnisse als Speicher- bzw. Vektorregistermittel, in wel- 
chem bzw. welches die erhaltenen Daten abzulegen sind, nicht 
einen internen Speicher zu benutzen, in welchen Daten liber 
eine STORE-Konf iguration in den Cache- oder einen anderen Be- 
5 reich, auf welchen die Sequenziell-CPU oder eine andere 

Datenverarbeitungseinheit zugreifen konnen, wegzuschreiben 
sind, sondern statt dessen unmittelbar die Ergebnisse wegzu- 
schreiben in entsprechende, insbesondere zugrif f sreservierte 
Cachebereiche, die insbesondere Slice-artig organisiert sein 

10 konnen. Dies kann gegebenenf alls den Nachteil einer grofieren 
Latenz haben, insbesondere wenn die Wege zwischen der XP'P- 
oder Datenverarbeitungslogikzellenfeldeinheit und dem Cache 
so lang sind, dafi die Signallauf zeiten ins Gewicht fallen, 
fuhrt aber dazu, dafi gegebenenf alls keine weitere STORE- 

15 Konf iguration benotigt wird. Es sei im ubrigen erwahnt, dafi 
eine derartige Abspeicherung von Daten in Cache-Bereiche ei- 
nerseits, wie vorstehend beschrieben, dadufch nioglich ist, 
daJi der Speicher, in welchen geschrieben wird, physikalisch 
nahe beim Cache-Controller liegt und als Cache ausgestaltet 

20 ist, dass aber alternativ und/oder zusatzlich auch die Mog- 
lichkeit besteht, einen Teil eines XPP-Speicherbereiches, 
XPP-internen Speichers oder dergleichen, insbesondere bei RAM 
Ober PAEs unter die Verwaltung eines oder, nacheinahder meh- 
rerer Cache-Speichercontroller zu stellen. Dies hat dann 

25 Vorteile, wenn die Latenz beim Abspeichern der Verarbeitungs- 
ergebnisse, welche innerhalb des 

Datenverarbeitungslogikzellenfeldes bestimmt werden, gering 
gehalten werden soil, wahrend die Latenz beim Zugrif f auf den 
dann nur noch als „Quasi-Cache M dienenden Speicherbereich 
30 durch andere Einheiten nicht oder nicht signif ikant ins Ge- 
wicht fallt. 
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Es sei im iibrigen erwahnt, dafi auch eine Ausgestaltung derart 
moglich ist, dafi der Cache-Controller einer herkommlichen Se- 
quenziell-CPU einen Speicherbereich als Cache anspricht, der, 
ohne dem Datenaustausch mit dem Datenverarbeitungs- 
5 logikzellenf eld zu dienen, auf und/oder bei diesem physika- 
lisch liegt. Dies hat den Vorteil, dafi dann, wenn Anwendungen 
auf dem Datenverarbeitungslogikzellenf eld laufen,. die einen 
allenfalls geringen lokalen Speicherbedarf haben, und/oder 
wenn auch nur wenige weitere Konf igurationen bezogen auf die 

10 zur Verfiigung stehenden Speichermengen benotigt werden, diese 
einer oder mehreren Sequenziell-CPUs als Cache zur Verfiigung 
stehen konnen. Es sei erwahnt, dafi dann der Cache-Controller 
fur die Verwaltung eines Cache-Bereiches mit dynamischem Um- 
fang, d. h. variierender GroJJe ausgebildet sein kann und 

15 wird. Eine dynamsiche Cache-Umf angsverwaltung bzw. Cache- 

Umf angsverwaltungsmittel fur die dynamische Cache-Verwaltung 
wird typisch die Arbeitslast auf der Sequenziell-CPU und/oder 
dem Datenverarbeitungslogikzellenf eld beriicksichtigen. Mit 
anderen Worten kann beispielsweise analysiert werden, wie 

20 viele NOPs in einer gegebenen Zeiteinheit auf der Sequenzi- 
ell-CPU vorliegen und/oder wie viele Konf igurationen im XPP- 
Feld in dafiir vorgesehenen Speicherbereichen vorabgelegt sein 
sollen, urn eine schnelle Umkonf iguration, sei es im Wege ei- 
ner Wellenrekonf iguration oder auf andere Weise. Die hiermit 

25 offenbarte dynamische Cachegrosse ist dabei insbesondere be- 
vorzugt lauf zeitdynamisch, d. h . der Chacecontroller 
verwaltet jeweils eine aktuelle Cachegrosse, die sich von 
Takt zu Takt oder Taktgruppe andern kann. Es sei im iibrigen 
darauf hingewiesen, dali die Zugrif f sverwaltung eines XPP- 

30 bzw. Datenverarbeitungslogikzellenf eldes. mit Zugrif f als in- 
terner Speicher wie bei einem Vektorregister und als Cache- 
artiger Speicher fur den externen Zugriff was die Speicherzu- 
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griffe angeht bereits beschrieben wurde in der DE 196 54 595 
und der PCT/DE 97/03013 (PACT03) . Die genannten Schriften 
sind durch Bezugnahme zu Of f efibarungszwecken hiermit vollum- 
fanglich eingegliedert . 

5 

Vorstehend wurde auf Datenverarbeitungslogikzellenf elder Be- 
zug genommen, die insbesondere zur Laufzeit rekonf igurierbar 
sind. Es wurde diskutiert, dass bei diesen eine Konfigurati- 
onsverwaltungseinheit (CT bzw. CM) vorgesehen werden kann. 

10 Aus den diversen, zu Of f enbarungszwecken unter Bezug genomme- 
nen Schut zrechten des Anmelders sowie seinen weiteren 
Verof f entlichungen ist die Verwaltung von Konf igurationen per 
se bekannt. Es sei nun explizit darauf hingewiesen, dass der- 
artige Einheiten und deren Wirkungsweise, mit der 

15 insbesondere unabhangig von Ankopplungen an Sequenziell-CPUs 
etc. aktuell noch nicht benotigte Konf igurationen vorladbar 
sind, auch sehr gut nutzbar sind, urn im Multitaskingbetrieb 
und/oder bei Hyperthreading und/oder Multithreading einen 
Task- beziehungsweise einen Thread- und/oder Hyperthreadwech- 

20 sel zu bewirken. Dazu kann ausgeniitzt werden, dass wahrend 

der Laufzeit eines Threads oder Tasks in die Konf igurations- 
speicher bei einer einzelnen oder einer .Gruppe von Zellen des 
Datenverarbeitungslogikzellenf eldes, also beispielsweise ei- 
ner PAE eines PAE-Feldes (PA) auch Konf igurationen fur 

25 unterschiedliche Aufgaben, das heiilt Tasks oder Threads be- 
ziehungsweise Hyperthreads geladen werden konnen. Dies fuhrt 
dann dazu, dass bei einer Blockade eines Tasks oder Threads, 
etwa wenn auf Daten gewartet werden muss, weil diese noch 
nicht verfugbar sind, sei es, da sie von einer anderen Ein- 

30 heit noch nicht generiert oder empfangen wurden, 

beispielsweise auf Grund von Latenzen, sei es, weil eine Res- 
source derzeit noch durch einen anderen Zugriff blockiert 
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ist, dann Konf igurationen fur einen anderen Task oder Thread 
vorladbar und/oder vorgeladen sind und auf diese gewechselt 
werden kann, ohne dass der Zeitoverhead fur einen Konfigura- 
tionswechsel bei der insbesondere schattengeladenen 
5 Konf iguration abgewartet werden muss. Wahrend es prinzipiell 
moglich ist, diese Technik auch dann zu verwenden, wenn in- 
nerhalb eines Tasks die wahrscheinlichste Weiterfiihrung 
vorhergesagt wird und eine Vorhersage nicht zutrifft (predic- 
tion miss) , wird diese Art des Betriebs bei vorhersagef reiem 

10 Betrieb bevorzugt sein. Bei Verwendung mit einer rein sequen- 
tiellen CPU und/oder taehreren rein sequentiellen CPUs wird 
somit durch die Zuschaltung eines Konf igurationsmanagers eine 
Hyperthreadingverwaltungshardware realisiert . Verwiesen sei 
hinsichtlich dessen insbesondere auf PACT10 (DE 1.98 07 872. 2 , 

15 WO 99/44147; WO 99/44120). Dabei kann es als ausreichend er- 
achtet werden, insbesondere dann, wenn nur fur eine CPU 
und/oder einige wenige Sequenziell-CPUs eine Hyperthreading- 
verwaltung gewiinscht ist, auf bestimmte, in den speziell 
unter Bezug genommenen Schutzrechten beschriebene Teilschal- 

20 tungen wie den FILMO zu verzichten. Insbesondere wird damit 
die Verwendung der dort beschriebenen Konf igurationsmanager 
mit und/oder ohne FILMO fur die Hyperthreadingverwaltung fur 
eine und/oder mehrere rein sequenziell arbeitende CPUs mit 
oder ohne Ankopplung an eine XPP Oder ein anderes Datenverar- 

25 beitungslogikzellenfeld offenbart und hiermit fur sich 

beansprucht. Es wird hierin eine fur sich erf inderische- Be- 
sonderheit gesehen. Es sei im Obrigen erwahnt, dass eine 
Vielzahl von CPUs realisiert werden kann mit den bekannten 
Techniken f wie sie insbesondere aus PACT 31 (DE 102 12 621.6- 

30 53, PCT/EP 02/10572) bekannt sind, bei welchen innerhalb ei- 
nes Arrays eine oder mehrere Sequenziell-CPUs aufgebaut 
werden unter Ausnutzung eines oder mehrerer Speicherbereiche 
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insbesondere im Datenverarbeitungslogikzellenf eld fur den 
Aufbau der sequenziellen CPU, insbesondere als Befehls- 
und/oder Datenregister . Auch sei darauf verwiesen, dass be- 
reits in friiheren Anmeldungen wie PACT02, (DE 196 51 075.9- 
5 53, WO 98/26356), PACT 04 (DE 196 54 846.2-53, WO 98/29952), 
PACT08, (DE 197 04 728.9, WO 98/35299) offenbart wurde, wie 
Sequenzer mit Ring- und/oder Wahlf rei-Zugrif f-Speichern auf- 
gebaut werden konnen. - 

10 Es sei darauf hingewiesen, dass ein Task- beziehungsweise 

Thread- und/oder Hyperthreadwechsel unter Verwendung de.r be- 
kannten CT-Technologie derart erfolgen kann und bevorzugt 
auch erfolgen wird, dass einem per se bekannten, Software- 
implement iert en Bet riebs system-Scheduler oder dergleichen von 

15 der CT Perf ormance-Scheiben und/oder Zeitscheiben zugeordnet 
werden, wahrend welchen bestimmt wird., von welchen Tasks oder 
Threads nachfolgend welche Telle per se, unterstellt, dass 
Ressourcen frei sind, abzuarbeiten sind. Dazu sei ein Bei- 
spiel wie folgt gegeben: Zunachst soil ftir einen ersten Task 

20 eine Adressfolge generiert werden, gemafi welcher * wahrend der 
Ausfuhrung einer LOAD-Konf iguration Daten aus einem Cache- 
Speicher, an dem ein Datenverarbeitungslogikzellenf eld in" der 
beschriebenen Weise angekoppelt ist, geladen werden sollen. 
Sobald diese Daten vorliegen, kann mit der Abarbeitung einer 

25 zweiten, der eigentlichen Datenverarbeitungskonf iguration, 

begonnen werden. Auch diese kann vorgeladen werden, da sicher 
feststeht, dass diese Konf iguration, sofern keine Interrupts 
oder dergleichen einen vollstandigen Taskwechsel erzwingen, 
auszufuhren ist. In herkommlichen Prozessoren ist nun das 
30 Problem des sogenannten Cache-Miss bekannt, bei dem die Daten 
zwar angefordert werden, aber nicht im Cache fur den Ladezu- 
griff bereit liegen. Tritt ein solcher Fall in einer Kopplung 
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gemafi der vorliegenden Erfindung auf , kann bevorzugt auf ei- 
nen anderen Thread, Hyperthread und/oder Task gewechselt 
werden, der insbesondere zuvof von dem insbesondere soft- 
wareimplenientierten Betriebssystem-Scheduler und/oder einer 
5 anderen hard- und/oder softwareimplementierten, entsprechend 
wirkenden Einheit fur eine nachstmogliche Ausfiihrung bestimmt 
wurde und demgemali bevorzugt vorab in einen der verfiigbaren 
Konf igurationsspeicher des Datenverarbeitungslogikzellenf el- 
des insbesondere im Hintergrund wahrend der Ausfiihrung einer 

10 anderen Konf iguration, beispielsweise der LOAD-Konf iguration, 
welche das Laden jener Daten, auf die nun gewartet wird, .be- 
wirkt hat, geladen wurde,. Das fur die Vorabkonf iguration 
ungestort von der tatsachlichen Verschaltung der insbesondere 
grobgranular ausgebildeten Datenverarbeitungslogikzellen des 

15 Datenverarbeitungslogikzellenf eldes separate Konf igurations- 
leitungen von der konf igurierenden Einheit zu den jeweiligen 
Zellen direkt und/oder iiber geeignete Bussysteme gefuhrt sein 
konnen wie per se im Stand der Technik bekannt, sei hier noch 
einmal explizit erwahnt, da diese. Ausbildung hier besonders 

20. bevorzugt ist, urn ein ungest5rtes Vorabkonf igurieren ohne 

S'torung einer anderen, gerade laufenden Konf iguration zu er- 
moglichen. Wenn dann die Konf iguration, auf welche wahrend 
beziehungsweise auf Grund des Task-Thread- und/oder Hyper- 
threadwechsels gewechselt wurde, abgearbeitet wurde, und 

25 zwar, bei bevorzugten niclit teilbaren,. ununterbrechbaren und 
somit quasi atomaren Konf igurationen bis zum Ende abgeabeitet 
wurde, wird teilweise eine. weitere andere Konf iguration wie 
vorbestiirant dur'ch die entsprechenden Scheduler, insbesondere 
den betriebssystemartigen Scheduler festgelegt, abgearbeitet 

30 und/oder jene Konf iguration, zu welcher zuvor die zugehorige 
LOAD-Konf iguration ausgefuhrt wurde. Vor der Ausfiihrung einer 
Verarbeitungsfconf iguration, zu welcher zuvor eine LOAD- 
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Konf iguration ausgefiihrt wurde, kann insbesondere abgetestet 
werden, ob mittlerweile die entsprechenden Daten in das Array 
eingestromt sind, also die Latenzzeit , wiesie typisch auf- 
tritt, verstrichen ist und/oder die Daten tatsachlich 
5 vorliegen. 

Mit anderen Worten werden dann Latenzzeiten, wenn sie auftre- 
ten, weil z. B. Konf igurationen noch nicht einkonf iguriert 
sind, Daten noch nicht geladen und/oder Daten noch nicht weg- 

10 geschrieben wurden, uberbruckt und/oder verdeckt, indem 

Threads, Hyperthreads und/oder Tasks ausgefiihrt werden, wel- 
che schon vor konf iguriert sind und.welche mit Daten arbeiten, 
die schon verfiigbar sind beziehungswei.se die an Ressourcen 
weggeschrieben • werden konnen, die fur das Wegschreiben be- 

15 reits zur Verfugung stehen. Auf diese Weise werden 

Latenzzeiten weitgehend uberdeckt und es wird, eine hinrei- 
chende Anzahl von per se auszuf uhrenden Threads, Hyperthreads 
und/oder Tasks unterstellt, eine praktisch 100%-ige Ausnut- 
ziing des Datenverarbeitungslogikzellenf eldes erreicht. 

20 

Mit dem beschriebenen System bezuglich Datenstrom-Fahigkeit 
bei gleichzeitiger Ankopplung an eine Sequenziell-CPU und/ 
Oder bezuglich . der Ankopplung eines XPP-Array beziehungsweise 
Datenverarbeitungslogikzellenfeldes und simultan einer Se^ 

25 quenziell-CPU an eine geeignete Schedulereinheit wie einen 

Konf igurationsmanager Oder dergleichen lassen sich insbeson- 
dere ohne weiteres echtzeitf ahige Systeme realisieren. Zur 
/Echtzeitf ahigkeit muss gewahrleistet sein f dass auf eintref- 
fende Daten beziehungsweise Interrupts, die insbesondere das 

30 Dateneintreffen signalisieren, innerhalb einer in keinem Fall 
zu iiberschreitenden Maximal zeit reagiert werden kann. Dies 
kann beispielsweise geschehen durch einen Taskwechsel auf ei- 
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nen Interrupt hin und/oder, beispielsweise bei priorisierten 
Interrupts , durch Festlegung, dass ein gegebener Interrupt 
momentan zu ignorieren ist, w6bei auch dies innerhalb einer 
bestimmten Zeit festzulegen ist. Ein Taskwechsel bei derarti- 
5 gen echtzeitf ahigen Systemen wird typisch auf drei Arten 
erfolgen konnen, naittlich entweder dann, wenn ein Task eine 
bestimmte Zeit gelaufen ist (Watch-dog-Prinzip) , bei Nicht- 
zurverfugungstehen einer Ressource, sei es durch deren 
Blockade durch anderen Zugriff oder aufgrund von Latenzen 
10' beim Zugriff darauf, insbesondere in schreibender und/oder 
lesender Weise, das heifit bei Latenzen von Datenzugrif f en 
und/oder beim Auftreten von Interrupts. 

Mit der vorliegenden Erfindung kann die Echtzeitf ahigkeit ei- 
15 nes Datenverarbeitungslogikzellenfeldes nunmehr erreicht 

werden, indem eine oder mehrere von drei moglichen Variant en 
implement iert wird. 

Eine erste Variante dazu besteht darin, dass innerhalb einer 
20 von dem Scheduler beziehungsweise der CT ansprechbaren Res- 
source ein.Wechsei zur Abarbeitung beispielsweise eines 
Interrupts erfo'lgt. Sofern die Ansprechzeiten auf Interrupts 
oder andere Anf orderungen so grofi sind f dass wahrend dieser 
Zeit eine Konf iguration ohne Unterbrechung noch abgearbeitet 
•25 werden kann f ist dies unkritisch, zumal wahrend der Abarbei- 
tung der aktuell laufenden Konf iguration auf jener Ressource, 
die fur die Abarbeitung des Interrupts zu wechseln ist, eine 
Konfiguration zur Interruptabarbeitung vorgeladen werden 
kann. Die Auswahl der vorabzuladenden Interrupt-bearbeitenden 
30 Konfiguration .ist z. B. durch die CT durchzuf tihren . Es ist 
moglich, die Laufzeit der Konfiguration auf der fur die In- 
ter ruptbearbeitung freizugebenden bzw. zu wechselnden 
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Ressource zu begrenzen. Verwiesen wirci dazu auf 
PACT29/PCT(PCT/DE03/000942) . 



Bei Systemen, die schneller auf Interrupts reagieren miissen, 
5 kann es bevorzugt sein, eine einzelne Ressource, also bei- 
spielsweise eine separate XPP-Einheit und/oder Telle eines 
XPP-Feldes fur eine solche Abarbeitung zu reservieren. Wenn 
dann ein schnell abzuarbeitender Interrupt auftritt, ■ kann 
entweder eine fur besonders kritische Interrupts schon vorab 

10 vorgeladene Konf iguration abgearbeitet werdeh oder es wird 
sofort mit dem Laden einer Interrupt behandelnden Konf igura- 
tion in die reservierte Ressource begonnen. Eine Auswahl der 
jeweils fur den entsprechenden Interrupt erf orderlichen Kon- 
figuration ist durch entsprechende Triggerung, 

15 Waveabarbeitung usw. moglich. 



Es sei im Obrigen erwahnt, dass es mit den -schon beschriebe- 
nen Methoden ohne weiteres moglich ist, eine instantane 
Reaktion auf einen Interrupt zu erhalten, indem iiber die Ver- 

20 wendung von LOAD/ STORE-Konf igurationen eine Code-Reentranz 
erreicht wird. Hierbei wird nach jeder datenbearbeitenden 
Konf iguration oder zu gegebenen Zeiten, beispielsweise alle 
fiinf oder zehn Konf igurationen eine STORE-Konf iguration aus- 
gefiihrt und dann eine LOAD-Konf iguration unter Zugriff auf 

25 jene Speicherbereiche ausgefuhrt, in die zuvor weggeschrieben 
wurde. Wenn sichergestellt wird, dass die von der STORE- 
Konf igura-tion benutzten Speicherbereiche so lange unberiihrt 
bleiben, bis durch Fortschreiten im Task eine weitere Konfi- 
guration samtliche relevanten Inf ormationen (Zustande, Daten) 

30 weggeschrieben hat> ist sichergestellt, dass bei Wiederladen, 
also Wiedereintritt in eine zuvor bereits begonnene, aber 
nicht zu Ende gefuhrte Konf iguration oder Konf igurationskette 
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wieder dieselben Bedingungen erhalten werden. Eine solche 
Zwischenschaltung von LOAD/ STORE-Konf igurationen unter simul- 
tanem Schutz von noch nicht veralteten STORE- 
Speicherbereichen lasst sich automatisch ohne zusatzlichen 
5 Programmieraufwand sehr einfach generieren, z. B. von einem 
Compiler. Dort kann die Ressourcenreservierung gegebenenf alls 
vorteilhaft sein. Das bei der Ressourcenreservierung- und/oder 
in anderen Fallen auf zumindest eine Menge hochpriorisierter 
Interrupts durch Vorabladen von bestimmten Konf igurationen 
10 reagiert werden kann, sei noch einmal erwahnt. 

Eine weitere, besonders bevorzugte Variante der Reaktion auf 
Interrupts besteht dann, wenn zumindest eine der ansprechba- 
ren Ressourcen eine Sequenziell-CPU ist, darin, auf dieser 

15 eine Interrupt-Routine abzuarbeiten, in welcher wiederum Code 
fur das Datenverarbeitungslogikzellerif eld verboten ist. Mit 
anderen Worten wird eine Interrupt-Routine ausschliefilich auf 
einer Sequenziell-CPU abgearbeitet, ohne dass XPP-Datenverar- 
beitungsschritte aufgerufen werden. Dies garantiert, dass der 

20 Verarbeitungsvorgang auf dem Datenverarbeitungslogikzellen- 
feld nicht zu unterbrechen ist und es kann dann eine 
Weiterabarbeitung auf diesem Datenverarbeitungslogikzellen- 
f eld nach einem Taskswitch erfolgen. Obwohl damit die 
eigentliche Interrupt-Routine keinen XPP-Code besitzt, kann 

25 dennoch dafur gesorgt werden, dass auf einen Interrupt hin zu 
einem spSteren f nicht mehr echtzeitrelevanten Zeitpunkt mit 
der XPP auf einen durch einen Interrupt und/oder eine Echt- 
zeitanforderung erfassten Zustand und/oder Daten unter 
Verwendung des Datenverarbeitungslogikzellerif eldes reagiert 

30 werden kann. 
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Es ist bei der Erfindung moglich, bei einem an eine CPU ange- 
koppelten Datenverarbeitungslogikzellenf eld optimierte 
Konf igurationen in das Feld zii laden, das insbesondere aus 
einem Analog/Digital-Mischf eld bestehen kann und Zellen mit 
5 frequenzoptimierten Aspektverhaltnis besitzt. Beim Laden von 
Konfigurationen kann es nun sehr vorteilhaft sein, wenn Busse 
dynamisch aufbaubar sind. Die vorliegende Erfindung offenbart 
daher zugleich ein Verfahren zum dynamischen Aufbau von Bus- 
sen in Feldern miteinander kommunizierender Elemente, 
10 insbesondere rekonf igurierbarer Felder wie Prozessoren grob- 
granularer Felder, das in Verbindung mit den andere Aspekten 
besonders vorteilhaft ist, aber zugleich auch fur sich genom- 
men erf inderisch- 

15 Es ist bereits bekannt, grobgranulare Felder rekonf igurierba- 
rer Elemente vorzusehen, bei denen zwischen den 
rekonfigurierbaren Elementen Bussysteme verlaufen. In bekann- 
ten Anwendungen werden die Bussysteme, die die Verbindungen 
fur die Kommunikation der einzelnen Elemente untereinander ■ 

20 vorsehen, durch eine zentrale Einheit konf iguriert . Die Art 
und Weise, wie die Bus verbindung aufgebaut werden soil, kann 
dabei im Vorfeld bestimmt werden, etwa zu .einer Compilezeit. 
Denkbar ist auch eine Festlegung zur Laufzeit, bei der durch 
einen Scheduler oder dergleichen fur verschiedene, aktuell zu 

25 ladende Konfigurationen ein Busaufbau vorgenommen wird, . bzw. 
ein Routing. Auf die Anmeldung 102 36 272.8 wird hierzu ins- 
besondere hingewiesen, da diese Anmeldung bereits zeigt, wie 
aus unterschiedlichen Konfigurationen zur Ausfuhrung ein und 
desselben Programmes zu einer Laufzeit eine Auswahl erf olgen 

30 kann. 
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Es sind auch schon Bussysteme fur rekonf igurierbare Prozesso- 
ren bekannt, bei denen ein dynamischer Busaufbau erfolgen 
kann. Erwahnt sei, daJi es insbesondere moglich ist, Bussyste- 
' me zu mischen, namlich die bekannten, sogenannt „globalen" 
5 dynamisch aufbaubaren Busse und nicht dynamisch aufbaubare 
Busse. Dies gilt auch fur die nachfolgend offenbarten Bussy- 
steme und -verfahren, das heifit die beschriebenen Bussysteme 
und Verbindungsaufbauverf ahren miissen nicht die einzigen, in 
einem Feld zu verbindender Elemente vorzusehenden Bussysteme 
10 bzw. -verf ahren sein. 

Es ist auch moglich, und dies gilt auch fur Zwecke der vor- 
liegenden Erfindung, neben grobgranularen Einheiten mit 
insbesondere f eingranularer Steuerlogik, wie f eingranularen 

15 Triggernetzwerken usw. eine sogenannte Makrogranularitat vor- 
zusehen, bei der eine Vielzahl grobgranularer Elemente mit 
herkommlichen Bussystemen usw. zusammengef asst werden und bei 
denen dann mehrere solcher zusammengef asster, grobgranularer 
Elemente,. zwischen denen bereits Bussysteme in konf igurierba- 

20 rer oder fester Weise vorgesehen sein konnen, wiederum uber 

Bussysteme kommunizierende Telle einer ubergeordneten Einheit 
bilden. Hierarchische Strukturen fur derartige Anordnungen 
sind beispielsweise aus DE 199 26 538.0 od. PCT WO 00/77652 
bekannt. 

25 

Es ist oftmals wiinschenswert> Busse dynamisch auf zubauen, be- 
sonders dann, wenn ein Prozessor fur Multitasking, 
Multithreading, Hyperthreading usw. verwendet werden soil, 
und/oder insbesondere wenn sehr- grofie Felder aus zum Beispiel 
30 65.536 PAEs- oder mehr aufgebaut werden sollen. 
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In einem solchen Fall ist es wunschenswert, fur eine automa- 
tische, selbsttatige, d.h. selbsterstellende dynamische 
Verbindung von Start- und Zielfeldern innerhalb eines solchen 
Feldes sorgen zu konnen. Als Start- und/oder Zielelemente 
5 konnen auch neben den aus der herkommlichen XPP-Technologie 
bekannten PAEs Elemente vorgesehen werden wie IO-Ports, fel- 
dinterne Speicher, Speicher-Ios, FPGAs, sequentielle CPUs, 
Sequencer, FSM (Finit-State-Machines) reine Lesespeicher, 
reine Schreibspeicher, NILdevices, etc. 

10 

Die vorliegende Erfindung schlagt somit in einem weiteren 
Grundgedanken ein Verfahren zum dynamischen Aufbau einer Ver- 
bindung zwischen einem Sender und einem Empfanger uber einen 
einer Vielzahl moglicher Wege, der von Station zu Station 

15 fortschreitet, vor, bei welchem- vorgesehen ist, dass ausge- 

hend von einer. den Busaufbau bewirkenden Einheit (Sender und/ 
oder Empfanger) eine Anfrage an nachstliegende Stationen ge- 
sandt wird f welche fur den Busaufbau bereit stehen, diesen 
Stationen eine Kennziffer, hier gleichbedeutend, Kenngrofie, 

20 zugeordnet wird, ausgehend von wenigstens einer Vielzahl, be- 
vorzugt jeder freien Station, der eine Kennziffer zugeordnet 
wurde, eine Anfrage an nachstliegende Stationen nach der Ver-. 
fiigbarkeit der Stationen fur einen Busaufbau gesandt wird, 
den verfugbareh Stationen eine weitere Kennziffer zugeordnet 

25 wird, und dies fortgesetzt wird, bis das gewunschte Ende des 
Busses erreicht ist* 

Ein weiterer wesentlicher Aspekt der vorliegenden Erfindung 
nutzt somit die Erkenntnis aus, dass Busse problenifrei da- 
30 durch aufgebaut werden konnen, dass an nachstliegende 

t)bertragungs.stationen auf dem Weg eines moglichen Busses An- 
fragen. gesandt werden, ob diese Stationen ftir den Busaufbau 
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bereit stehen und dann, ausgehend von bereitstehenden Statio- 
nen, in einem weiteren Schritt diese nachstliegenden 
Stationen angesprochen werden,' wobei durch die Kennzif f erzu- 
ordnung eine Ansprechreihenf olge festgehalten wird, urn anhand 
5 derselben eine Riickverf olgung des Busaufbaus zu ermoglichen. 
Es ist dabei zwar moglich, dass nicht von jeder angesproche- 
nen und als frei erkannten Station beim Busaufbau 
weitergeschritten wird,, weil etwa eine Auswertung in der Sta- 
tion eines gewiinschten Zielpunktes zeigt, dass der Busaufbau 
10 sich weit in eine falsche Richtung bewegt hat, bevorzugt wird 
aber von jeder freien Station, der eine Kennzif fer zugeordnet 
wurde, versucht, den Bus weiter aufzubauen, indem die Nach- 
barstationen der zuerst angesprochenen Station gleichfalls 
angesprochen werden. 

15 

Hintergrund hierfiir ist, dass es Situationen geben kann, etwa 
bei einem bereits nahezu vollen Array, in welches weitere 
Konf igurationen hineingesetzt werden sollen, wo es erforder- 
lich ist, einen Busaufbau uber gr515ere Umwege zuzulassen, um, 
20 sollte ein Busaufbau uberhaupt moglich sein, diesen sicher zu 
ermoglichen. 

In einer bevorzugten Variante wird regelmaliig, jeder Station, 
die angesprochen wurde, eine Kennzif fer zugewiesen. Dies ist 

25 . vorteilhaft, um f estzustellen, dass die Station bereits ange- 
sprochen wurde und somit nicht mehr bei Ansprechen aus einer 
anderen Richtung vermeintlich zur Verfugung steht. Dies ver- 
hindert,, dass eine Signalausbreitung noch stattfindet, 
nachdem die Nachbarstationen bereits wieder als nicht bene- 

30 tigt freigegeben wurden. 
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In einer besonders bevorzugten Variante wird die Kenngrofie 
von Station zu Station so verandert, dass der Weg, der beim 
Busaufbau gewahlt wird r nachvollziehbar ist, insbesondere im 
Wege eines Backtracking. Dieses Backtracing kann durch Inkre- 
5 mentierung oder Dekrementierung eines am Ziel erreichten 

Wertes erfolgen, insbesondere mit jeweils fester Schrittwei- 
te. Bei Vorsehen einer festen Schrittweite kann insbesondere 
auch ein zyklisches Zahlen erfolgen, d. h. ein Zahlen in ei- 
nem zyklischen Zahlenraum, bei dem nach Oberschreiten des 

10 hochst moglichen Wertes immer wieder mit einem kleineren Wert 
begonnen wird (z. B. 1, 2, 3, 4; 1, 2, 3, 4; 1, 2, 3, 4; 

Oder 1, 2, 3, A, 5; 1, 2, 3, A, 5; 1, 2, 3, 4, 5; 

) . Dabei ist dann zur Charakterisierung der Station, um 

ein einwandfreies Ruckverf olgen des Weges zu gewahrleisten, 

15 ein zyklisches Durchzahlen von mindestens drei verschiedenen 
Zahlwerten bevorzugt. 

Das beschriebene Verfahren wird, sofern uberhaupt ein Busauf- 
bau zwischen Sender und Empf anger moglich ist, diesen 

20 auf zubauenden Bus j identif izieren. Beim Busaufbau werden aber 
womoglich eine Vielzahl nicht benotigter. Stationen angespro- 
chen und es ist daher bevorzugt, diese wieder freizugeben, 
und zwar nach Aufbau des Busses bzw. mit der Signalisierung 
zwischen Sender und Empfanger, dass' ein Busweg aufgebaut wur- 

25. de, Dazu kann ausgehend von der letzten, den Aufbau 

vollendenden Station, typisch als dem Signalempf anger, wenn 
der Busaufbau ausgehend vom Sender hin zum Empfanger erfolgt, 
riickwarts unter Abschreitung der Kennwerte die. davorliegende 
Station angesprochen werden und sichergestellt werden, dass 

30 die von dieser Station angesprochenen, anderen und somit 
nicht auf dem Bus (ruck) weg liegenden Stationen fur eine 
Fremdnutzung freigegeben werden. Dabei wird von jeder ange- 
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sprochenen und fur die weitere Benutzung in anderen Buswegen 
freigegebenen Stationen wiederum f ortgeschritten zu alien an- 
deren, nicht benotigten Stationen, die zuvor angesprochen 
wurden. Auf diese Weise ist sichergestellt , dass alle Static- 
5 nen, die zuvor fur den Busaufbau angesprochen wurden, nunmehr 
wieder zur Verfugung stehen. 

Es sei erwahnt, dass neben diesem Verfahren zur ruckschrei- 
tenden Freigabe eines aufgebauten Busweges andere 

10 Moglichkeiten existieren, nach Aufbau eines Busweges zwischen 
Sender und Empf anger nicht benotigte Stationen freizugeben. 
So kann etwa langs aller Stationen, die fur den Busweg beno- 
tigt werden, ein Signal gesandt werden, welches den 
Busstationen mitteilt, dass sie am Busweg beteiligt sind. Ei- 

15 ne solche Information kann wiederum ruckwarts gesandt werden 
im Wege des Back-tracing, etwa indent die Kennziffern ausge- 
wertet werden, die den Stationen wahrend der Aufbauphase 
zugeordnet wurden. Danach kann eine globale Freigabe erfol- 
gen, etwa indem ausgehend von der Anf angsstation oder einer 

20 zentralen Kontrollinstanz samtliche, momentan nicht an beste- 
henden Bussen verwendeten Stationen zuruckgesetzt bzw. fur 
den Aufbau eines Busweges freigegeben werden. 

Es sei darauf hingewiesen, dass etwa auch unter bestimmten 
25 Bedingungen, wie nach einem festen Zeitablauf , eine Busfrei- 
gabe erfolgen kann. Diese Art der Freigabe. kann allerdings 
verhindern, dass Busse, die per se aufbaubar waren, aufgebaut 
werden konnen; so ist bei sehr grofien Prozessorf elderh denk- 
bar, dass die Wege extrem lang werden, weil urn verschiedene, 
30 im Laufe des Betriebes dynamisch in das Feld hineinkonf igu- 
rierte Zellgruppenanordnungen maanderf ormig ein Weg herum 
bzw. durch solche Konf igurationeh gelegt werden muss, was bei 
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grofien Feldern sehr lange dauern kann. Sorge ist daher bevor- 
zugt dafiir zu tragen, dass eine hinreichende Zeit fur den 
Aufbau eines Busses verbleibtl 

5 Es sei erwahnt, dass es prinzipiell moglich ist, insbesondere 
in sehr grofien Feldern, simultan mehrere Buswege bzw. Busver- 
bindungen zwischen unterschiedlichen Stationen und 
unterschiedlichen Empfangern aufzubauen. Dies kann jedoch da- 
zu fiihren, dass sich zwei aufzubauende Busverbindungen 

10 wechselseitig im Fortschreiten blockieren, so dass keiner von 
den beiden Bussen erfolgreich eine Verbindung aufbaut. Es 
kann mit anderen Worten zu einem Deadlock koinmen.. Dass derar- 
tige Deadlock-Situationen auch bei simultanem Aufbau mehrerer 
Busse verhindert werden konnen, sei. erwahnt. So ist yorstell- 

15 bar, Bussen. eine Prioritat zuzuordnen und damit zu 

gewahrleisten, dass dann, werin ein auf zubauender Bus hoher 
Prioritat auf einen gleichf alls noch nicht "auf gebauten Bus 
geringerer Prioritat trifft, die Stationen des Busses mit ge- 
ringerer Prioritat besetzt werden, d. h. dass die vorherige 

20 Reservierung fur einen auf zubauenden. Bus geringerer Prioritat 
ignoriert wird. Dabei wird die tatsachliche Implement ierung 
derartiger Verbindungsaufbauten abhangig davon zu gestalten 
sein, wie die fur die Busaufbauprotokollumsetzung erforderli- 
che Logik in eine Halbleiterarchitektur umzusetzen .ist, d. h. 

25 welcher Aufbau im Einzelfall erforderlich ist; wie der Bu- 

saufbau und erf orderlichenf alls der Versuch eines Neuaufbaus 
nach Scheitern eines ersten Versuchs auszusehen hat, ob eine. 
Priorisierung erfolgen soli und kann, wobei vorstellbar ist, 
eine Priorisierung eines auf zubauenden Busses etwa nach Be- 

30 deutung des Makros, das in das Feld konfiguriert wird, der 
Wartezeit seit dem Versuch eines ersten Aufbaus usw.', zu be- 
stimmen. 
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Prinzipiell ware es moglich, nach dem Erreichen des Ziels 
ausgehend vom Start, also typi'sch nach Erreichen des Empf an- 
gers ausgehend vom den Busaufbau typisch bewirkenden Sender, 
5 lediglich ein Signal auszusenden, das dem Sender anzeigt, 
dass uberhaupt ein Bus aufbaubar ist, damit dieser mit dem 
Senden beginnen mag. In einem solchen Fall konnte ein abzu- 
sendendes Datenpaket einfach wie eine Stationsaufbauanf rage 
an alle Nachbarstationen gesandt werden. Es miisste dann aber 

10 mit jedem Datenpaket sichergestellt werden, dass am Empf anger 
erkannt werden kann, von wo, das heifit von welcher Station 
ein abgesandtes Datenpaket zuerst empfangen wird, es muss si- 
chergestellt werden, dass ein bestimmtes Datenpaket nur 
einmal empfangen wird, auch wenn es ttber andere, verschlunge- 

15 ne Pfade spater noch einmal zum Empf anger gelangt. Bevorzugt 
wird aber in jedem Fall sein, dass die anderen Stationen 
freigegeben werden, etwa durch Back-tracing nach Erreichen 
der Zielstation. Dieses Busbeteiligungssignal, das ruckwarts 
gesandt wird, kann ausgehend von den Zahlenwerten, die den 

20 Nachbarstationen zugeordnet werden, erfolgen. Im tibrigen sei 
darauf hingewiesen, dass es gleichfalls moglich ist, dass 
sich die Station lediglich merkt, aus welcher Richtung aus 
sie angesprochen wurde. In einem solchen Fall kann ohne Ver- 
gleich. an den Nachbarstationen, welche Kennzif f erwerte diese 

25 besitzen, eine Ruckverf olgung sehr schnell geschehen und es 
kann tiberdies dann, wenn' in der Station festgehalten wird, 
welche Nachbarstationen beim Busaufbau noch angesprochen wur- 
den, gewahrleistet werden, dass auch beim Back-tracing die 
nicht am aufgebauten Bus beteiligten Stationen freigegeben 

30 werden. 
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Die einer Station beim Ansprechen zuzuordnende Kennziffer 
kann daher auch eine Kennziffer sein, die die Richtung an- 
gibt, von welcher aus die Station angesprochen wurde. Bei 
vier nachsten anzusprechenden Nachbarn reichen dafur bei- 
5 spielsweise zwei Bit. Werden zusatzlich noch die Stationen 
gespeichert, die angesprochen worden sind, wahrend der Bus 
aufgebaut wurde, sind weitere vier Bit erforderlich bei einer 
Vier-nachste-Nachbarn-Architektur. Es kann ein weiteres Bit 
hinzugefugt werden, urn zu kennzeichnen, ob die Station uber- 

10 haupt schon angesprochen wurde oder voiu Busaufbau des aktuell 
auf zubauenden Busses bislang unberiihrt geblieben war. Kommen 
Priorisierungen und dergleichen dazu, sind weitere Zustande 
festzuhalten. Es sei darauf hingewiesen, dass dies feingranu- 
lar erfolgen kann, und zwar insbesondere auch dann, wenn das 

15 Prozessorfeld fur sich grobgranular aufgebaut ist. 

Es sei weiter darauf hingewiesen, dass verschiedene Moglich- 
keiten existieren, nach dem erf olgreichen Aufbau eines ersten 
Busses zwischen einem ersten Sender und einem ersten Empfan- 

20 ger den Aufbau eines zweiten Busses, zwischen z. B. einem 
zweiten Sender und einem zweiten Empf anger zu ermoglichen; 
dabei kann auch einer der Sender und/oder einer der Empfanger 
identisch sein. Das Ansprechen von zwei Empfangern aus ein 
und demselben Sender kann sinnvoll sein, wenn etwa ein Be- 

25 rechnungsergebnis als Eingang fur zwei verschiedene Zweige 

eines Programmes, die in unterschiedliche Bereiche hineinkon- 
figuriert sind, bendtigt wird. Ein Ansprechen eines einzelnen 
Empfangers aus mehreren Sendern kann erwunscht sein, wenn 
* dort etwa zwei Operanden, die aus unterschiedlichen Konfigu- 

30 rationsbereichen erhalten werden sollen, zu verknupfen sind, 
und ein Ansprechen von einem Empfanger tiber ein und denselben 
Sender kann geboten sein, wenn Operanden, die zu unterschied- 
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lichen Zeiten erhalten bzw. bestimmt wurden, an ein unci dem- 
selben Empfanger miteinander verkntipft werden sollen, etwa in 
der Form a n x a n -i. Es kann danri iiber Register im Bus sicherge- 
stellt werden, dass eine solche Verkniipfung nach Aufbau von 
5 zwei Bussystemen moglich ware, auch wenn dies typisch schon 
aus Grunden des Energieverbrauches im Bus system weniger be- 
vorzugt ware als eine lokale Zwischenspeicherung von 
Operanden und dergleichen. Der Aufbau des weiteren oder 
nachst auf zubauenden Busses kann etwa dadurch erfolgen, dass 

10 mit dem Stationsf reigabesignal nach vorlaufiger Reservierung 
einer Station ein Signal mitgesandt wird, welches angibt, 
welchem aufgebauten Bus die Station gehdrte, wobei dieser Bus 
etwa wiederum durch ein Priorisierungssignal gekennzeichnet 
werden kann. Wenn eine freigebende Station dann einer Station 

15 benachbart liegt, die gerne selbst einen Bus aufbauen wurde, 
der eine geringfugig niederere Priorisierung hat, kann dies 
dort festgestellt werden und es kann dann von dieser Station 
ausgehend der nachste Busaufbau bewirkt werden. Alternativ 
kann, bei einer globalen Freigabe aller momentan nicht an ei- 

20 nem Busaufbau benotigten Stationen und/oder danach ein 

globales Signal abgesandt werden, etwa von einer zentralen 
Kontrollinstanz, welches dem Feld mitteilt, welche Busverbin- 
dung als nachste aufzubauen ist bzw. welche Prioritat die 
nachste aufzubauende Busverbindung haben soil. Statt eines 

25 globalen Broadcast einer derartigen Bus auf bauverwaltungs in- 
formation kann auch insbesondere zentral und/oder an mehreren 
Stellen dezentral, etwa bei hierarchisch angeordneten Prozes- 
sorfeldern, bei denen innerhalb eines bestinimten Bereiches 
ein Bus- aufbau gewiinscht wird, lokal und/oder regional eine 

30 Signalisierung an eine einen Busaufbau anfordernde Station 

wie einen Sender, der seinen Empfanger erreichen muss, erfol- 
gen. 
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Welche Art der Stationsf reigabe und/oder der Mitteilung / dass 
ein weiterer Bus aufgebaut werden kann, tatsachlich implemen- 
tiert wird, wird insbesondere davon abhangig sein, wie 
5 schnell die diesbeziigliche Information iiber das Array propa- 
giert werden kann urid/oder welche Busaufbauhauf igkeit ttber 
der Zeit" erwartet wird. So kann dann, wenn eine Analyse 
zeigt, dass die auf einem Feld typisch benotigten und simul- 
tan abzuarbeitenden Konf igurationen selten einen Busaufbau 

10 erfordern, der zudem langsam erfolgen kann, eine prozessorar- 
chitektonisch einfache Implement ierung gewahlt werden, die 
mit wenigen Logikelementen auskommt, urn die entsprechende 
Steuerung zu gewahrleisten, wahrend bei sehr haufigem und 
auch schnell benotigtem Busaufbau eine komplexere Implemen- 

15 tierung sinnvoll sein kann. 

In einer besonders bevorzugten Variante isf es moglich, unter 
mehreren per se bezuglich der Buslange und/oder des Umfangs 
der Stationen entlang des Busses gleichwertiger Bussysteme 

20 einen Bus auszuwahlen anhand verschiedener objektiver Beur- 
teilungskriterien. Wahrend es prinzipiell moglich ist, in 
einem solchen Fall eine zufallige Wahl zu treffen, konnen, je 
nach Anforderung und tatsachlicher Auslegung, unterschiedli- 
che Kriterien herangezogen werden. Es kann etwa bei 

25 Architekturen, die unterschiedliche Busverbindungen in Hori- 
zontal- und Vertikalrichtung aufweisen, etwa wenn die 
Busverbindungen in Vertikalrichtung zusatzlich Register um- 
fassen, durch welche .die Daten zu schleusen sind, wahrend 
langs der Vertikalrichtung registerfrei und somit Daten mit 

30 geringeren Energieverlusten weiterleitende Busverbindungen 

existieren (ein Beispiel fur eine solche Architektur ist die 
XPP 128 des Anmelders) , • vorgesehen sein, dass beim Busaufbau 
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vermerkt wird, wie viele Schritte horizontal und vertikal ge- 
gangen wurden. Diese Information kann in einer Station 
abgelegt werden Oder an einem 'Header , der mit dem Busauf- 
bauanforderungssignal mitiibertragen wird; es erfolgt dann zur 
5 Busauswahl eine Auswertung derartiger Inf ormationen. Alterna- 
tiv kann etwa an jeder Station abgefragt werden, wie viele 
Busse in der Nahe der Station bereits existieren, urn etwa zu 
ermdglichen, dass eine naherungsweise gleichmafiige Busverbin- 
dungsdichte iiber das Array hinweg erhalten wird. Dieses 

10 Vorgehen ist einer seits vorteilhaft , weil der Datentransport. 
langs der Busse auf Grund der erforderlichen Umladung der 
Busleitungskapazitaten, den in Bussen zu integrierenden Trei- 
bern usw. einen erhohten Energieverbrauch ergibt,. weshalb 
eine Vergleichmafiigung der Busverteilungsdichte uber das Pro- 

15 zessorfeld zu einer VergleichmaBigung der thermischen 

Belastung fiihrt. Insofern kann durch die Vergleichmafiigung 
insgesamt womoglich die Taktrate bei gleicher Kuhlung erhoht 
werden, was im Bereich mobiler Prozessoren fur Laptops, Han- 
dys und dergleichen vorteilhaft ist. . Andererseits ist ^ine 

20 . BusverbindungsdichtevergleichmaBigung auch vorteilhaft fiir 
die Auslastungserhohung und Re s s our cens chonung . 

Schutz wird auch beansprucht ftir ein multidimensionales Feld 
rekonf igurierbarer Elemente, in welchem Bussysteme ftir den 

25 dynamischen Selbstaufbau in einer der vorbeschriebenen Weisen 
und/oder in einer Weise, wie sie aus djsm nachfolgenden er- 
sichtlich ist,' vorgesehen sind. Es sei darauf hingewiesen, 
dass die Bezeichnung ^multidimensionales Feld rekonf igurier- 
barer Elemente" sich auf grobgranulare rekonf igurierbare 

30 Elemente mit Elementen wie ALUs, erweiterten ALUs, RAMPAEs 
usw. beziehen kann, wie sie vorerwahnt wurden, und dass im 
Sinne der Erfindung eine Multidimensionalitat nicht nur durch 
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die raumliche Ubereinanderanordnung und Nebeneinanderanord- 
nung von rekonf igurierbaren Elementen erhalten werden kann, 
sondern auch durch eine bestimmte Art und Weise der Verbin- 
dung. So sind in linear angeordneten Feldern den Elementen in 
5 der Mitte zwei nachste Nachbarn zugeordnet, in zweidimensio- 
nalen Feldern wie b£i einer Kachelung typisch vier nachste 
Nachbarn, und in einer dreidimensionalen Anordnung typisch 
sechs nachste Nachbarn, wie dies aus der Stapelung von Wiir- 
feln und dergleichen erkannt werden kann. Die Verwendbarkeit 

10 etwa drei- oder sechseckiger Zellen sei beispielhaft erwahnt. 
Es ist aber auch moglich, zusatzlich Busverbindungen vorzuse- 
hen, die diagonal verlaufen, tlbernachste Nachbarn verbinden, 
groliere Strecken vorsehen usw. Wird eine solche Busstruktur 
implementiert, ergibt sich eine Multidimensionalitat mit ei- 

15. nem Dimensionsmafi grofler 1, wobei dieses Dimensionsmafi auch 
von einer ganzen Zahl verschieden sein kann. Eine solche An- 
ordnung wird in jedem Fall als multidimensionales Feld der 
vorliegenden Erfindung betrachtet. 

20 Die vorliegende Erfindung wird im Folgenden nur beispielswei- 
se an Hand der Zeichnung beschrieben. In dieser zeigt: 

Elein multidimensionales Feld miteinander kommuni- 
zierender rekonf igurierbarer Element e, die fur 
den Busaufbau ausgebildet sind, vor dem Beginn 
des Busaufbaus; 
E2 das Feld von Fig. 1 nach dem ersten Busaufbau- 
schritt;' 

E3 das Feld von Fig. 1 nach dem zweiten Busaufbau- 
schritt; 



Fig. 



25 



Fig. 
Fig. 



30 
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Fig. E4 das Feld von Fig. 1, nachdem das Empf angerf eld 

erreicht wurde, mit unterschiedlichen, moglichen 
Busverbindungen; . 

Fig. E5 die Anordnung mit dem ausgewahlten Bus. 

5 

Nach Fig. 1. umfasst ein allgmein mit 1 bezeichnetes Feld 1 
eine Vielzahl rekonf igurierbarer Zellen, die miteinander uber 
selbstaufbauende Busse kommunizieren konnen. 

10 Jede Zelle la, lb, lc usw., die am Busaufbau zu beteiligen 

ist, weist interne Logikelemente auf, die es ermoglichen, In- 
formationen daruber zu speichern, ob die Zelle derzeit von 
einem Bus bereits verwendet wird (mit X gekennzeichnete Zel- 
len in Feld 1) , ob die Zelle bereits als mogliche Buszelle 

15 bei einem aktuellen Busaufbau angesprochen wurde, und, wenn 
ja, in wie vielen vertikalen und horizontalen Schritten der 
Busaufbau bis zur Zelle erfolgte, wie viele' Schritte insge- 
samt beim Busaufbau zuruckgelegt wurden oder ob die Zelle 
noch vollstandig frei ist und noch nicht angesprochen wurde. 

20 Urn die Anzahl der horizontal bzw. vertikal von einem Bus "be- 
reits abgeschrittenen Zellen auf dem Weg zwischen einer 
moglichen Senderzelle S und einer mo.glichen Empf angerzelie e 
abzulegen, sind in jeder Zelle zwei Speicherbereiche vorgese- 
hen, die in den Figuren mit H und V bezeichnet sind. Weiter 

25 ist ein Speicherbereich fiir die Gesamtzahl der durchlauf enen 
Schritte ablegbar, wie durch die grossen Zahlen 1 - 12 in den 
Figuren 1 - 5 dargestellt. babei ist die gewahlte Maximalzahl 
12 nur beispielhaft, da dies im gewahlten Beispiel geringer 
Komplexitat die erf orderliche Schrittzahl zum Erreichen des 

30 Empf angers, ausgehend vom gewahlten Sender, ist. Die Zellen 
sind weiter dazu ausgebildet, dann, wenn sie ein Busaufbauan- 
forderungssignal erhalten und frei. sind, an einem 
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auf zubauenden Bus teilzunehmen, und zugleich an Nachbarsta- 
tionen in einem nachf olgenden Schritt eine Anfrage zu senden, 
ob diese Nachbarstationen gleichfalls fur den Busaufbau frei 
sind. Dazu weisen sie Signal-Sende- und -Empf angsverbindungs- 
5 beschaltungen fur die jeweils nachsten Nachbarn auf. Die 

einzelne Zelle ist weiter so ausgebildet, dass zusammen mit 
dem Busaufbauanf orderungssignal Information bezuglich der 
insgesamt schon zuruckgelegten Schrittweite und der Anzahl 
der horizontalen und vertikalen Teilschritte (H und V) an die 
10 angesprochenen Stationen iibermittelt werden kann. 

Der Busaufbau geschieht im vorliegenden Fall wie folgt: 
Zunachst wird das dynamisch konf igurierbare Array derart be- 
trieben, dass alle Busse aufgebaut seien. Es mogen dann 

15. bestimmte Konf igurationen enden und es sei erf orderlich, eine 
neue Konf iguration f ragmentiert in freie Bereiche des Arrays 
hineinzukonf igurieren, weil eine hinreichende Anzahl funktio- 
nell geeigneter Zellen derzeit nicht zur Verfugung steht. Es 
sei dabei weiter ein Fall gegeben, bei welchem alle Felder 

20 bis auf die mit X bezeichheten fur den Busaufbau zur Verfu- 
gung stehen. 

Nun wird von jenen Zellen, die miteinander z.u. kommunizieren 
haben, urn ein in das Array hineinzukonf igurierendes Makro 

25 ausfuhren zu konnen, eine Sende- und eine Empf angszelle fest- 
gelegt. Dies kann durch die Konf iguration bzw. den Scheduler 
oder ahnliches geschehen. Diese sind in Fig. 1 mit S bezeich- 
net. Nun sendet die den Busaufbau bewirkende Sender zelle S 
ein erstes Busaufbauanf orderungssignal an ihre unmittelbaren 

30 Nachbarn, das heisst jene Zellen, die an deren Zellenkanten 
angrenzen, im dargestellten Beispiel also an vier Zellen. 
Diese Zellen stellen fest, dass sie frei sind, dass sie die 
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ersten Stationen sind, die Busaufbauanf orderungssignale er- 
halten, und dass sie jeweils einen Schritt horizontal oder 
vertikal respektive von der Sendezelle entfernt sind. Es wird 
nun in den Nachbarzellen entsprechend in den H- und V- 
5 Speicherbereich eine 0 bzw. 1 eingespeichert, und es wird ei- 
ne 1 in den Schrittweitenspeicher der angefragten Zelle 
gespeichert. 



Im zweiten Schritt spricht jede zuvor angesprochene freie 
10 Zelle wiederum ihre eigenen Nachbarzellen an und fragt bei 
diesen an, ob sie fur den Busaufbau zur Verfugung stehen. 
Dies ftihrt dazu, dass eine Reihe weiterer Zellen danach er- 
kannt haben, dass sie fur den Busaufbau benotigt werden und 
die zweiten Zellen im Verlauf eines moglicherweise aufgebau- 
15 ten Busses darstellen. Weiter werden entsprechende Vermerke 
tiber die horizontale bzw. vertikale Schrittweite in entspre- 
chenden Speicherbereichen abgelegt. Die bereits mit X 
gekennzeichneten Zellen ignorieren hingegen das Busaufbauan- 
f or derungs signal, wie das in der 4. Zelle von links, 2. Zeile 
20 " von unten der Fall ist. 

Nachdem die ersten Zellen ihre Nachbarzellen. angesprochen ha- 
ben, ist klar, dass sie in weiteren Busaufbauschritten 
schweigen konnen; ein Busanf orderungs signal wird so nur un- 

25 mittelbar im Schritt nach jenem ausgesandt, welcher die das 
. Busaufbauanf orderungssignal aussendende Zelle reserviert hat. 
Dies verhindert zwar, dass Zellen, die erst wahrend des Bus- 
aufbaus freigegeben. werden, spater noch reservierbar sind, 
spart aber, da nicht immer wieder von alien bereits reset- 

30 vierten Zellen Busaufbauanf orderungssignale ausgesandt werden 
mussen, was Treibe'rleistung erfordert, Energie und ist somit 
etwa fur mobile Anwendungen bevorzugt, wo der erhaltene Vor- 
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teil uberwiegt gegenuber Losungen, bei denen spater freiwer- 
dende Zellen auch noch in einen entstehenden Bus 
miteinbezogen werden konnen; hier ware allerdings besonders 
etwa Sorge dafiir zu tragen, dass stets in jenen Nachbarzellen 
5 der Bus-aufbau als relevant eingestuft wird, die die gering- 
sten Schrittweiten langs des Busses erfordern. im nachsten 
Busaufbauschritt sprechen nun die zweiten Zellen ihre jewei- 
ligen Nachbarzellen wiederum an, wobei, da die Zellen 1 fur 
den Busaufbau schon reserviert sind, die Zellen 2 nicht mehr 
10 zurucklaufen konnen, sondern nur nach vorne, weg vom Sender. 
Dies setzt sich fort, bis der Empfanger schliefilich erreicht 
ist, vergleiche Fig. 4. 

Es sind nun im Beispiel am Empfanger zwei Zellen gleichzeitig 
15 angekommen, die beide die gleiche Schrittweite 12 tragen und 
es ist, wie durch die verschieden gestrichelten Linien er- 
sichtlich, moglich, liber diese Zellen rtickwartsschreitend 
unterschiedliche Buswege aufzubauen. Es ware hier. zwar prin- 
zipiell eine zufallige Auswahl moglich, es wird aber, wie 
20 bevorzugt, zunachst bei jedem Abschreiten in Riickwartsrich- 
tung versucht, die V-Werte maximal zu halten. Dies fuhrt zu 
dem durchgehend gezeichneten Bus in Fig. 5. Sobald der Bu- 
saufbau durch Rtickwartsschreiten bestatigt wurde, konnen alle 
Zellen, die nicht daran beteiligt sind, abgewiesen und wieder 
25 freigegeben werden. bazu wird ein globales Busf reigabesignal 
ausgestrahlt, das anzeigt, dass alle derzeit nicht an einem 
aufgebauten Bus beteiligten Zellen sich zurtlcksetzen. kfinnen. 

Es sei erwahnt, dass die Art und Weise des Busaufbaus durch 
30 dynamische Selbstorganisation unter Verwendung geeigneter, 
dem Durchschnittsf achmann aus der Offenbarung ersichtlichen 
Hardwareschaltungen in der Zelle festlegbar ist. 
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Paten tanspjrdche 

1. Verfahren zur Auswahl eines aus einer Vielzahl von Wegen 
5 zur Erzielung eines Datenverarbeitungsergebnisses bei der 

Datenverarbeitung unter zumindest moglicher Verwendung 
multidimensionaler Felder konf igurierbarer Datenhandha- 
bungselemente, dadurch gekennzeichnet, dali den 
Datenhandhabungselementen konf igurationsabhangig lei- 
10 stungsaufnahmebezogene kennzeichnende Grolien zugeordnet 

werden und eine Wegauswahl unter Zuordnungsbewertung er- 
folgt. 

2. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
15 kennzeichnet , dali einer aus einer Vielzahl 

unterschiedlicher Algorithmen ausgewahlt wird. 

3. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet , 

20 dali eine aus einer Vielzahl unterschiedlicher Konfigura- 

tionen ausgewahlt wird. 

4. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 

25 dali iiber die Zuordnung einer gegebenen Datenverarbeitungs- 

aufgabe und/oder -teilaufgabe an ein multidimensionales 
Feld konfigurierbarer Datenhandhabungselemente und/oder 
einer anderen Datenverarbeitungsarchitektur, insbesondere 
an ein ASIC, und/oder an eine rein sequenziell arbeitende 

30 CPU bei der Wegauswahl entschieden wird. 
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5. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 
dafi ein zweidimensionales Feld konf igurierbarer Datenhand- 
habungselemente betrachtet wird. 

5 

6. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 
dafi eine Auswahl aus einem zur Laufzeit konf igurierbaren, 
insbesondere storungsfrei partiell rekonf igurierbaren Pro- 

10 zessorfeld vorgenommen wird. 

7 . Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet/ 
dali als konf igurierbare Datenhandhabungselemente zumindest 

15 einige, bevorzugt alle der Elemente Busse, Register, ALUs, 

RAMs und/oder andere grobgranulare Datenhandhabungselemen- 
te betrachtet werden. 

8. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
20 oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 

dali der kennzeichnende Wert unabhangig von der tatsachli- 
chen aktuell zugeordneten Aufgabe nur davon abhangig 
gewahlt wird, ob das jeweilige Datenhandhabungselement 
ttberhaupt verwendet wird oder nicht. 

25 

9. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dafi jeder Konf igurat ion eine eigene Kennzahl 
bei der Verwendung zugeordnet wird. 

30 10. Verfahren nach dem vorhergehenden unabhangigen An- 

spruch oder einem Unteranspruch hierzu , dadurch 
gekennzeichnet, dafi eine strom-, arbeits- und/oder lei- 
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stungsbezogene Grofie als verbrauchskennzeichnende Grofie 
zugeordnet wird. 

11. Verfahren nach dem vorhergehenden Anspruch, dadurch 
5 gekennzeichnet , dafi eine Auswahl unter Berucksichtigung 

eines Summenwertes verbrauchskennzeichnender Grofien er- 
folgt. 

12. Verfahren nach dem vorhergehenden unabhangigen An- 
10 spruch oder einem Unteranspruch hierzu , dadurch 

gekennzeichnet, dafi eine Auswahl unter Berucksichtigung 
weiterer Grofien erfolgt, insbesondere einer erf orderlichen 
Ausf uhrungszeit und/oder erf orderlicher Ressourcen, einer 
aktuellen Prozessorauslastung und/oder einer aktuell ge- 
15 wunschten und/oder moglichen Leistungsaufnahme. 

13. Verfahren nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi eine Auswahl vor der eigent lichen Da- 
tenverarbeitung erfolgt. 

20 

14. Verfahren nach dem vorhergehenden unabhangigen An- 
spruch oder einem Unteranspruch hierzu , dadurch 
gekennzeichnet, dafi die KennzeichnungsgrSBen bei der Simu- 
lation einer Datenverarbeitung bereitgestellt und/oder 

25 ausgewahlt werden. 

15. Verfahren nach dem vorhergehenden unabhangigen An- 
spruch oder einem Unteranspruch hierzu , dadurch 
gekennzeichnet, dafi eine Auswahl zur Laufzeit erfolgt. 

30 

16. Verfahren zum Betrieb eines multidimensionalen Feldes 
rekonf igurierbarer Elemente, 
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worin Anordnungen von 

Gruppen zusarnmen datenhandhabender Elercente in vorbestinm- 
ter Weise wahrend der Laufzeit zur Abarbeitung 
vorgegebener Aufgaben in das Feld hinein konf iguriert wer- 

5 den, 

dadurch gekennzeichnet, dali 

far zumindest eine abzuarbeitende Aufgabe eine Mehrzahl 
von solchen Elementgruppenanordnungen im multidimensiona- 
len Feld bestimmt wird, die zur Abarbeitung der 
10 vorgegebenen Aufgabe geeignet sind, 

fur die Abarbeitung der vorgegebenen Aufgabe eine dann be- 
sonders geeignete Elementgruppenanordnung aus der Mehrzahl 
ausgewahlt wird und 

die ausgewahlte in das Feld hinein konfiguriert wird. 

15 17 verfahren nach dem vorhergehenden Anspruch dadurch ge- 
kennzeichnet, dafi die Elementgruppenanordnung anhand rhrer 
Geometrie im Vergleich mit der Geometrie im Feld berexts 
fur die Umkonfiguration verfugbarer und/oder vermutlich 
20 bald verfUgbar werdender Elemente ausgewahlt wird. 

18 Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , worin Elementgruppenan- 
ordnungen betref fende Konf igurationsdaten aus einem 
Speicher mit nicht vernachlassigbaren Zugrif f szeiten exn- 
gelesen werden und/oder mit nicht vernachlassigbaren 
Generierungszeiten generiert werden, dadurch gekennzeich- 
net, dafi zumindest fur einige Konf igurationen fur die 
Auswahl zunachst nur ein gegenuber dem Konf igurationsda- 
tensatz aller Konf igurationsdaten in der Gr5*e reduzierter 
Kenndatensatz, insbesondere ein Satz von die Geometrie be- 
treffenden Kenndaten, in eine 



25 



30 
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Elementgruppenanordnungsauswahlstuf e eingelesen werden, 
eine Auswahl aufgrund des Kenndatensatzes getroffen wird 
und dann im Ansprechen auf die Auswahl die Konf igurations- 
daten aus dem Speicher gelesen oder generiert werden. 

5 

19. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , worin bei der Umkonfigu- 
rierung des Feldes zur Durchf iihrung einer Mehrzahl 
zumindest teilweise simultan auszuf iihrender Aufgaben, von 

10 denen fur wenigstens zwei Gruppen zusammen Daten handha- 

bender Elemente in vorbestimmter Weise wahrend der 
Laufzeit zur Abarbeitung vorgegebener Aufgaben in das Feld 
hinein konfiguriert werden, 

eine Mehrzahl von solchen Elementgruppenanordnungen, die 
15 zur Abarbeitung der vorgegebenen Aufgabe geeignet sind, 

vorbestimmt werden, 

die zu einer gegebenen Zeit und/oder einem gegebenen Er- 
eignis fur die zumindest teilweise simultane 
Hineinkonf iguration verfugbarer Ressourcen bestimmt werden 
20 und jene Elementgruppenanordnungen aus der vorbestimmten 

Anzahl ausgewahlt werden, mit denen eine simultane Abar- 
beitung besonders effizient moglich ist. 

20. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
25 oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 

daft eine erste Elementgruppenanordnung in das Feld hinein- 
konfiguriert wird, mit dieser Elementgruppenanordnung 
begonnen wird, die Aufgabe abzuarbeiten, bis ein vorgege- 
benes Ereignis auftritt und danach unter zumindest 
30 partieller Rekonf iguration mit der Auf gabenabarbeitung in 

einer weiteren Elementgruppenanordnung fortgefahren wird. 
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21. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , worin die Elementgrup- 
penanordnungen sich hinsichtlich der 

Abarbeitungsgeschwindigkeit unterscheiden und die Auswahl 
5 im Ansprechen auf die gegebenenf alls unter Berucksichti- 

gung weiterer Aspekte maximal erzielbare 
Abarbeitungsgeschwindigkeit erf olgt . 

22. Multidimensionales Prozessorf eld aufweisend 
eine Vielzahl benachbart angeordneter Datenverarbeitungs- 
zellen mit 

Eingangen, die Daten von Vernetzungswegen erhalten, 
einer Operanden-Verknupf ungseinheit , die diese entspre- 
chend der jeweiligen Funktion ihrer Operanden- 
Verknupf ungseinheit verknupfen und 

Ausgangen, urn die Daten verkmipft auf Vernetzungswege 
auf zugeben, 

dadurch gekennzeichnet, dafi 
die Datenverarbeitungszellen ein Aspektverhaltnis aufwei- 
sen, das wenigstens 2:1, bevorzugt 2:1 betragt. 

23. Multidimensionales Prozessorf eld nach dem vorhergehenden 
Anspruch, dadurch gekennzeichnet, dafi die Datenverarbei- 
tungszellen als grobgranular konf igurierbare Zellen 

25 ausgebildet sind. 

24. Multidimensionales Prozessorf eld nach dem vorhergehenden 
unabhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dali Datenverarbeitungszellen in 

30 Reihen und Spalten angeordnet sind. 



10 



15 



20 
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25. Prozessorfeld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi zumindest bei einem Teil der Datenver- 
arbeitungszellen Dateneingange vorgesehen sind, urn von 
einer oberen Reihe Daten zu erhalten und Datenausgange, urn 

5 an eine untere Reihe Daten auszugeben. 

26. Prozessorfeld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi die Datenverarbeitungseinheiten EALUs, 
ALU und/oder registerf lankierte Zellen sind. 

10 

27. Verfahren zur Konf igurierung eines Prozessorf eldes nach 
dem vorhergehenden unabhangigen Anspruch oder einem Un- 
teranspruch hierzu , worin Zellen fur die Konf iguration 
ausgewahlt und in Funktion und Vernetzung bestimmt werden, 

15 wobei eine Vernetzung derart bestimmt wird, dafi Daten von 
Zelle zu Zelle zumindest weitgehend verzogerungsf rei uber- 
tragbar sind, dadurch gekennzeichnet, dafi als benachbarte 
Zellen, zwischen denen Daten binnen eines Taktes oder ei- 
ner geringen Taktzahl ubertragbar sind, auch solche 

20 berucksichtigt werden, die nicht unmittelbar nebeneinander 
liegen, sondern in der Breite durch eine Strecke getrennt 
sind, die geringer ist als die Lange der Zelle. 

28. Multidimensionales Prozessorfeld aufweisend 

25 eine Vielzahl benachbart angeordneter Datenverarbeitungs- 

zellen mit 

Eingangen, die Daten von Vernetzungswegen erhalten, 
einer Operanden-Verkntipf ungseinheit , die diese entspre- 

chend der jeweiligen Funktion ihrer Operanden- 
30 Verkntipfungseinheit verknupfen und 

Ausgangen, urn die Daten verknupft auf Vernetzungswege 

auf zugeben, 
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dadurch gekennzeichnet , dafi 
die Datenverarbeitungszellen ein Aspektverhaltnis aufwei- 
sen, das wenigstens 2:1, bevorzugt 2:1 betragt. 

5 29. Multidimensionales Prozessorf eld nach dem vorhergehenden 
Anspruch, dadurch gekennzeichnet, dafi die Datenverarbei- 
tungszellen als grobgranular konf igurierbare Zellen 
ausgebildet sind. 

10 30. Multidimensionales Prozessorf eld nach dem vorhergehenden 
unabhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi Datenverarbeitungszellen in 
Reihen und Spalten angeordnet sind. 

15 31. Prozessorf eld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi zumindest bei einem Teil der Datenver- 
arbeitungszellen Dateneingange vorgesehen sind, urn von 
einer oberen Reihe Daten zu erhalten und Datenausgange, urn 
an eine untere Reihe Daten auszugeben. 

20 

32. Prozessorf eld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi die Datenverarbeitungseinheiten EALUs, 
ALU und/oder registerf lankierte Zellen sind. 

25 33. Verfahren zur Konf igurierung eines Prozessorf eldes nach 
dem vorhergehenden unabhangigen Anspruch oder einem Un- 
teranspruch hierzu , worin Zellen fur die Konf iguration 
ausgewahlt und in Funktion und Vernetzung bestimmt werden, 
wobei eine Vernetzung derart bestimmt wird, dafi Daten von 

30 Zelle zu Zelle zumindest weitgehend verzSgerungsf rei uber- 

tragbar sind, dadurch gekennzeichnet, dafi als benachbarte 
Zellen, zwischen denen Daten binnen eines Taktes oder ei- 
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ner geringen Taktzahl iibertragbar sind, auch solche be- 
rucksichtigt werden, die nicht unmittelbar nebeneinander 
liegen, sondern in der Breite durch eine Strecke getrennt 
sind, die geringer ist als die Lange der Zelle. 

5 

34. Datenverarbeitungsanordnung mit einem multidimensionalen 
Feld 

in Funktion und/oder Vernetzung konf igurierbarer Zelle- 
lemente und 

10 diesen zugeordneten Konf igurationsvorhaltemitteln zum 

lokalen Konf igurations-Vorhalten, 
dadurch gekennzeichnet , dali 

die Konfigurationsvorhaltemittel dazu ausgebildet sind, 
zumindest einen Teil der vorgehaltenen Konf igurationen 
15 nichtf luchtig vorzuhalten. 

35. Datenverarbeitungsanordnung mit einem multidimensionalen 
Feld 

in Funktion und/oder Vernetzung konf igurierbarer Zelle- 
20 lemente und 

diesen zugeordneten Konf igurationsvorhaltemitteln zum 
lokalen Konf igurations-Vorhalten, 
dadurch g e k e n n z e i c h n e t , dafi 

die Konfigurationsvorhaltemittel dazu ausgebildet sind, 
25 zumindest einen Teil der vorgehaltenen Konf igurationen 

nichtf luchtig vorzuhalten. 

36. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 

30 dadurch gekennzeichnet, dali die Funktion grobgranular kon- 

figurierbar ist. 
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37. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi die Vernetzung grobgranular 
konf igurierbar ist. 

5 

38. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch Oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi als Zellelemente zumindest ei- 
nes von ALUs, EAlUs, RAM-Zellen, I/O-Zellen, Logiblocken 

10 vorgesehen sind. 

39. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi jedem Zellelement ein eigenes 

15 Konf igurationsvorhaltemittel zugeordnet ist. 

40. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi die Konf igurationsvorhaltemit- 

20 tel dazu ausgebildet sind, eine Vielzahl von 

Konf igurationen vorzuhalten. 

41. Datenverarbeitungsanorndung, dadurch gekennzeichnet, dafi 
mehrere fest vorgegebene nichtf luchtige Konf igurationen im 

25 Konf igurationsvorhaltemittel vorgegeben sind. 

42. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet, dafi die Anordnung dazu ausgebildet 

30 ist, eine wechselnde einer Vielzahl von vorgehaltenen Kon- 
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figurationen zu verwenden, insbesondere im Wege der Wa- 
ve-Rekonf iguration oder des lokalen Sequencing. 

43. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
5 abhangigen Anspruch oder einem Unteranspruch hierzu , 

dadurch gekennzeichnet , dafi bei eingien Zellen im Betrieb 
mit veranderlichen Konf igurationen versehbare Konfigurati- 
onsvorhaltemittel vorgesehen sind. 

10 44. Datenverarbeitungsanordnung nach dem vorhergehenden un- 
abhangigen Anspruch oder einem Unteranspruch hierzu , 
dadurch gekennzeichnet , dafi als Konf igurationsvorhaltemit- 
tel zunmindest eines aus ROM, EPROM, EE PROM/ Flash- 
Speicher, Fuse-, Antif use-programmierbare Speichermittel 

15 und/oder in insbesondere in oberen Lagen einer Silizium- 

struktur fest vorgesehene Speichermittel gewahlt sind. 

45. Verfahren zur Herstellung einer dedizierten Datenverar- 
beitungsanordnung, dadurch gekennzeichnet, dafi ein 

20 multidimensionales Feld mit in Funktion und/oder Vernet- 

zung konf igurierbaren Zellelemente und diesen zugeordneten 
Konf igurationsvorhaltemitteln zum lokalen Konf igurations - 
Vorhalten vorgegeben wird, bestimmt wird, welche Konfigu- 
rationen in diesen vorzuhalten sind, und dann 

25 nichtf liichtige Konf igurationsvorhaltemittel so vorgesehen 

werden, dafi sie zumindest einen Teil der vorgehaltenen 
Konf igurationen nichtf liichtig vorhalten. 

46. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
30 kennzeichnet, dafi von einem zur lauf zeitrekonf igurierbaren 

multidimensionalen Feld ausgegangen wird. 
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47. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dafi zunSchst von einem zur 

lauf zeitrekonf igurierbaren multidimensionalen Feld mit re- 
konf igurationsbeschaltung ausgegangen wird und dann fur 
rekonf iguration nichtbenotigte Felder weggelassen werden. 

48. Rekonf igurierbare Signalverarbeitungsvorrichtung mit ei- 
ner Vielzahl von miteinander, insbesondere konf igurierbar 
verkniipfbaren Signalverarbeitungsschaltkreisen, die in 
ihrer Funktion veranderlich sind, wobei diese einen Aus- 
gang aufweisen, uber welchen eine Umkonf igu-rierung 
angefordert und/oder eine Akzeptierung einer Umkonf igura- 
tion vorgesehen werden kann, dadurch gekennzeichnet , dass 
zumindest ein Teil der verknupf baren Signalverarbeitungs- 
schaltkreise analoge Signalverarbeitungsschaltkreise 
sind/ wobei weiter eine Rekonf igurationseinheit zur Vor- 
gabe von Konf igurationen fur die das Analogsignal 
verarbeitenden Schaltkreise vorgesehen ist. 

49. Rekonf igurierbare Signalverarbeitungsvorrichtung nach dem 
vorhergehenden Anspruch, dadurch gekennzeichnet , dass ein 
Teil der Signalverarbeitungsschaltkreise digitale Schalt- 
kreise sind. 

50. Datenverarbeitungsvorrichtung mit einem Datenverar- 
beitungslogikzellenf eld und zumindest einer Sequenziell- 
CPU, dadurch gekennzeichnet , dass eine Ankopplung der Se- 
quenziell-CPU und des Datenverarbeitungslogikzellenf eldes 
zum Datenaustausch in insbesondere blockweiser Form durch 
zu einem Cache-Speicher fuhrende Leitungen moglich ist. 
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51. Verfahren zum dynamischen Aufbau 

einer Verbindung zwischen einem Sender und einem Empfan- 
ger 

uber einen einer Vielzahl moglicher Wege, der von Station 
zu Station f ortschreitet , 

dadurch gekennzeichnet, dass 

ausgehend von einer den Busaufbau wirkenden Einheit (Sen- 
der und/oder Empf anger) eine Anfrage an nachstliegende 
Stationen gesandt wird, welche fur den Busaufbau bereit 
stehen, 

diesen Stationen eine Kennziffer zugeordnet wird, 
ausgehend von wenigstens einer Vielzahl, bevorzugt jeder 
freien Station, der eine Kennziffer zugeordnet wurde, ei- 
ne Anfrage an nachstliegende Stationen nach der 
Verfiigbarkeit der Stationen fur einen Busaufbau gesandt 
wird, 

den verfugbaren Stationen eine weitere Kennziffer zuge- 
ordnet wird, und dies fortgesetzt wird, bis das 
gewunschte Ende des Busses erreicht ist. 

52. Verfahren nach dem vorhergehenden Anspruch, worin von 

Station zu Station, die jeweils fur ein Fortschreiten des 
Busaufbaus verfugbar ist, unabhangig davon, ob mit dieser 
Station das Ziel erreicht werden wird oder nicht, eine 
veranderte Kennziffer zugewiesen wird. 

53. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass die Veranderung von Station zu Station 
nachvollziehbar gewahlt wird, wobei insbesondere eine In- 
crementierung oder Decrement ie rung eines Zahlwertes urn 
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eine feste GrcMJe erfolgt, insbesondere mit Schrittweite 
gegebenenfalls durch zyklisches Zahlen, d.h. Zahlen in 
einem endlichen, zyklischen Zahlenraum. 

54. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass zyklisch bis mindestens drei 
verschiedene Zahlwerte zur Charakterisierung der Station 
durchgezahlt werden. 

55. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
Oder einem Unteranspruch hierzu , dadurch gekennzeich- 
net, daft nach Aufbau eines Bus-Weges zwischen Sender und 
Empfanger nicht benotigte Stationen wieder freigegeben 
werden. 

56. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 
dass ein Bus als aufgebaut betrachtet wird, sobald von 
einer Station aus das Ziel erreicht worden ist. 

57. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass nach dem Aufbau eines ersten Busses 
der Aufbau weiterer Busverbindungen unterbunden wird. 

58. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass den an einem aufgebauten Bus 
beteiligten Stationen das Erreichen des Busaufbaues mit- 
geteilt wird. 

59. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass den an einem aufgebauten Bus 
beteiligten Stationen das Erreichen des Busaufbaues mit- 
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geteilt wird, 

indem ausgehend vom Ziel in Ruckwartsrichtung den am Bus 
beteiligten Stationen ein Busbeteiligungssignal zugesandt 
wird, insbesondere durch Obertragen von Signalen entlang 
5 des Busses* 

60. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass die Identif ikation der am aufgebauten 
Bus beteiligten Stationen erfolgt r indem ausgehend vom 
10 Ziel die den erreichbaren Stationen gegebenenfalls zuge- 

ordneten Zahlenwerte verglichen werden und jene Stationen 
ausgewahlt werden, die einen buszugehorigkeitsindikativen 
Zahlenwert besitzen. 

15 61. Verfahren nach dem vorhergehenden Anspruch, worin ausge- 
hend von einer Startposition die Zahlenwerte 
incrementiert werden, wShrend beim Busaufbau von Station 
zu Station fortgeschritten wird und worin nach Erreichen 
des Ziels jene Stationen als zum Bus zugehorig identif i- 

20 ziert werden, die jeweils die kleinsten Zahlenwerte 

erreichbarer Stationen besitzen. 

62. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass eine Freigabe nicht fur eine 

25 Busverbindung benotigter Stationen durch Markierung jener 

Stationen, die an einem aufgebauten, benotigten Bus teil- 
haben, und Freigeben aller nicht dergestalt markierten 
Stationen, insbesondere durch das Senden eines globalen 
Freigabesignals erfolgt. 

30 

63. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch ge kennzeichnet , 
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dass die Freigabe nicht benotigter Stationen wellenartig 
durch Zurucklaufen von einer Ziel- zu einem Starteinheit 
erfolgt und/oder durch Ruckwartslauf en vom Ziel zum Start 
unter Freigabe nicht benotigter Stationen durch Senden 
5 eines Freigabesignals durch jeweils jene Station, die bei 

der freizugebende Station zuvor angefragt hatte, ob sie 
fur den Busaufbau zur Verfugung stehe. 

64. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
10 oder einem Unteranspruch hierzu , worin simultan eine 

Vielzahl von Busverbindungen aufgebaut wird, dadurch ge- 
kennzeichnet, dass zu jeder fur den Aufbau einer 
Busverbindung angesprochehen Station ein Richtungswert 
zugeordnet wird, insbesondere in der Station abgespei- 
15 chert wird, der angibt, aus welcher Richtung oder von 

welcher ansprechenden Station ein Busaufbauanf orderungs- 
signal erhalten wurde . 

65. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
20 kennzeichnet, dass die Busverif ikation durch Auswertung 

der Signale erfolgt, die anzeigen, von welcher anspre- 
chenden Station aus ein Busaufbauanf orderungssignal 
gesandt wurde und worin der Busaufbau zu dieser anfor- 
dernden Station hin erfolgt. 

25 

66. Verfahren nach dem vorhergehenden unabhangigen Anspruch 
oder einem Unteranspruch hierzu , dadurch gekennzeichnet, 
dass bei Vorliegen mehrerer, eine gleiche Anzahl von Sta- 
tionen benotigender Busse, die potenziell aufbaubar sind, 

30 ein Bus anhand eines dem Bus zuweisbaren und/oder zuge- 

wiesenen Beurteilungskriterium ausgewahlt wird. 



- 121 - 



ERSATZBLATT (REGEL 26) 



WO 2004/021176 




'CT7EP2003/008081 



67. Verfahren nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, dass als Busbeurteilungskriterium die 
Anzahl horizontal und/oder vertikal durchlauf ender Sta- 
tionen und/oder die Anzahl registerbehaf teter Stationen 
5 und/oder die Verbindungsdichte existierender Busverbin- 

dungen langs der Stationen und/oder die Grofie 
verbleibender freier Felder, die nicht durch den Bus ver- 
teilt werden, herangezogen wird. 

68* Multidimensionales Feld rekonf igurierbarer Elemente, wo- 
bei zumindest zwischen einigen der konf igurierbaren 
Elemenmte dynamisch aufbaubare Busse vorgesehen sind, da- 
durch gekennzeichnet, dass im Bussystem Einheiten 
vorgesehen sind, die dazu ausgebildet sind, direkt Oder 
uber Fernbusse indirekt benachbarte Gruppen in Bussegmen- 
ten anzusprechen und/oder eine Busstationsnummer zu 
speichern und/oder eine Bef Srderungssignalrichtung zu 
speichern und/oder einen Abbau von temporar gehaltenen 
Verbindungen zu womoglich fur einen Busaufbau benotigten 
Stationen nach Feststellung des Nichtbenotigens durch 
Freigabe zu ermoglichen, 

69. Datenverarbeitungsvorrichtung mit einem Datenverarbei- 

tungslogikzellenfeld und zumindest einer Sequenziell-CPU, 
25 dadurch gekennzeichnet , dass eine Ankopplung der Sequen- 

ziell-CPU und des Datenverarbeitungslogikzellenf eldes zum 
Datenaustausch in insbesondere blockweiser Form durch zu 
einem Cache-Speicher fiihrende Leitungen moglich ist. 



10 



15 



20 
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: nt ' Q Use of (staggered) Jong tracks" 



> Increases operating frequency 
* Decreases transistor count and area 




W- t QThree additional strategies: 

*5-j ■ Operate at different frequencies, i.e.: 
;V: - MIPS uP Core at 400 MHz 

- PACT XPP Core at 200 MHz 
^-'""1 ■ Registers in each bus-connect 

- PAEs act sequentially, one output each 2nd or 4th clock cycle 




Fig. 6 



1/18 



2004/021176 



T/EP2003/008081 



PACT ; 

' ' , • I 



*.1 



□Trade-off between area and sequentially 

• Basic operation of compiler technology can be used to achieve 
abstraction layer 

■ Generate .compressed" configurations, which are expanded on 
larger arrays while loading 

■ No minimum array but maximum array defined by compiler setting 

• Tradeoff: Number of (re-)corrflgurations vs. usable ALU-PAEs 
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a Basic Operation Method 

■ LOAD/STORE processor 

■ RAM-PAEs act as Vector-Registers (2D/3D) 

• Irregular data access patterns are linearized by 
LOAD/STORE while accessing RAM-PAEs 
• Can be done by uP also! 

■ LOAD ... Conf, ... Con^ Con£... STORE 

■ Each Configuration is regarded as an OpCode 

■ No Configuration/Array internal status 
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□ Code Analysis 

■ Data Dependency Analysis 

• Data Flow Analysis 

• Interprocedural Alias Analysis 

• Pointer analysis: statically allocated data, dynamically allocated data 

■ Interprocedural Value Range Analysis 
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□ Code Optimizations . 
■ Loop Transformations 

• Loop Normalization 

• Loop Reversal 

■ Loop-Invariant Code Motion 

• Loop Unswftching 

• Loop Interchange 

• Loop Tiling 

• Loop Skewing 

• Loop Coalescing/Collapsing 

• Loop Fusion 

• Loop Distribution 

• Loop Unrolling 

• Loop Peeling 

• Loop Splitting 

• Loop Pushing/Embedding 



Strength Reduction 

Induction Variable Semination 

Strip Mining 

Scalar Expansion 

Array Contracting/Shrinking 

Scalar Replacement 

Reduction Recognition 

Idiom Recognition 

Procedure Mining 

Software Pipelining 

Vector Statement Generation 

Node Splitting 

If Conversion 

Statement Reordering 




□ RAM-PAEs RAM is .embedded 1 * into cache 

□ RAM-PAEs can operate like cache-lines 

■ Homogeneous embedded in cache 

■ Handling access rights between uP and XPP 
• Handling context switching / hyperthreading 

■ Abstracting non linear address patterns 
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Fig. 19b 
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□ XPP operates like an RISC-Processor 
Q RAM-PAEs act like registers 

□ Each configuration is atomar (unbreakable) 

□ Configurations running time is limited 

□ LOAD Configuration 

• Loads external data into internal RAM-PAEs 

a Data operations (one or multiple configurations) 

• Unbreakable - no Internal status to be savedl 

□ STORE Configuration 
■ Stores internal data into external RAM-PAEs 
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□ Interrupts (Task/Thread-Switches) only between 
(re)configurations not at runtime 
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H QXPP Technology allows sequential 

•ipACT- processing 

■■' ^ V"J ■ Within ALU-PAEs using the configuration register file as a random 

- s ; v *^v; access code memory 

y > j • Coupling an ALU-PAE with a RAM-PAE. ALU-PAE acts like a uC, 

5 ■ *■ . /" • RAM-PAE ts according Data- and Code-Memory 

As an enhancement IO-PAEs can be used to access peripheries and 
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□ Optimum trade-off between sequencing and dataflow 
PACT j processing 



Configurable ALU-PAE / RAM-PAE Sequencers 
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:, ^ g □ Handled by sequential processing within PAEs 
; ^ | . ■ I.e. Floating-Point, Division etccan be emulated by 
sequential multicycle PAE operations 



Higher precision is calculated as a multicycle operation 
• results are transferee! in two bus cycles 
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